LIVE
modèles3/3 up
gatewayOK
p508.0s
p958.0s
txeu-fr · electron-server
№ 02 · modèles servis

Modèles finaux & auto-router.

Les workers actifs, l'auto-router agentique, le statut de la flotte, les scores bench origine vs tuné, le chemin d'une requête, et le playground — sur une seule page.

L'auto-router, par domaine.

Le prompt entre. Un classifier embeddings le situe sur l'un des 47 domaines. Le routeur ouvre la politique YAML correspondante et choisit le spécialiste. Sur les domaines hardware, la sortie passe par un validator Docker sandboxé avant retour utilisateur.

1
Prompt utilisateur
« Génère le schéma KiCad d'un convertisseur boost 12V→24V »
POST /api/public/chat
2
Classifier MiniLM-L6-v2 + MLP
MiniLM-L6-v2 384d · MLP 2 couches (hidden 256) · 47 domaines · cache L1 hash + L2 cosinus sémantique
kicadspicestm32emcembeddedcodemath
domaine ∈ HARDWARE_DOMAINS ?
Branche hardware
3a
Spécialiste qwen36-*
LoRA qwen36-35B hot-swap fine-tunée sur le domaine (kicad / spice / stm32 / emc / embedded / power…) · serveurs multi-LoRA :9360 / :9361
sortie LLM
4a
Validator Docker sandboxé
--network=none --read-only --cap-drop=ALL · KiCad DRC, ngspice, g++, shellcheck, tsc, FreeCAD scripting…
exit ≠ 0 → reflector retry
Branche directe
3b
Backend généraliste
Mistral-Medium 128B · Qwen3-Coder-Next 80B (raisonnement) · EuroLLM 22B (multilingue) · Devstral-Small 24B (code) · Pixtral 12B (vision) — servis via omlx :8500
sortie directe
Pas de validator
Math, traduction et généraliste restent en politique direct (1-shot).
NDJSON audit trail · SSE retour utilisateur
5
Réponse streamée à l'utilisateur
Audit-grade : prompt_hash, output_hash, seed, validator_image_digest tous loggés en NDJSON pour rejouabilité Annex IV

Statut de la flotte.

Gateway et workers actifs, sondés en direct via /api/public/status toutes les 15 secondes. 3 / 3 healthy.

gateway :9300 · router v9 · live probe3 / 3 healthy
Mac Studio · omlx multi-model :8500
studio · studio-omlx
GPU · Apple M3 Ultra (76-core GPU) · 512 GB
10 modèles servis
Mistral-Medium-3.5-128B-MLX-Q8DeepSeek-R1-Distill-Qwen-32BQwen3-Coder-30B-A3BQwen3-Coder-Next-8bit (80B MoE)EuroLLM-22Bgranite-4.1-30bMixtral-8x22BDevstral-Small-2-24BPixtral-12Bgemma-4-E4B
latence
8019 ms
GPU
VRAM
temp
tokens / j
kWh / j
~5.16
état
UP
Mac Studio · Qwen3.6-35B multi-LoRA (hardware/EDA/math) :9360
studio · studio-qwen36-hardware
GPU · Apple M3 Ultra (76-core GPU) · 512 GB
1 modèle servi
Qwen3.6-35B-A3B-MLX-BF16 + 30 LoRA hot-swap
latence
8016 ms
GPU
VRAM
temp
tokens / j
kWh / j
~5.16
état
UP
Mac Studio · Qwen3.6-35B multi-LoRA (code/web/lang) :9361
studio · studio-qwen36-code
GPU · Apple M3 Ultra (76-core GPU) · 512 GB
1 modèle servi
Qwen3.6-35B-A3B-MLX-BF16 + 30 LoRA hot-swap
latence
8016 ms
GPU
VRAM
temp
tokens / j
kWh / j
~5.16
état
UP
charge et tokens / j = lecture live si le worker expose ces compteurs, sinon « — ». kWh / j = estimation conservatrice TDP × 24h / 1000 (valeur enveloppe, pas la consommation réelle mesurée).

Bench — origine vs tuné.

iact-bench v1, sandbox Docker épinglé par digest. Score = % cellules avec validator exit-zéro. Origine = modèle base sans routage. Tuné = via auto-router + validator chain.

DomaineOrigineTunéΔModèle
KiCad DSL12%67%+55ailiance/auto
KiCad PCB18%60%+42ailiance/auto
SPICE simulation21%46%+25ailiance/auto
STM32 embedded28%71%+43ailiance/auto
EMC analysis24%58%+34ailiance/auto
Power electronics31%64%+33ailiance/auto

Source : iact-bench · seed crc32(domaine + index) · digest validator sha256 épinglé

Catalogue final.

Les workers actifs (LIVE) et les références featured du catalogue. Pour le catalogue HuggingFace complet (24 adaptateurs), voir la model card de chaque entrée.

ailiance/mistral-medium-3.5-128b

Mistral Medium 3.5 128B

LIVE

128B params · MLX Q8 · 262k context · omlx (Mac Studio M3 Ultra)

baseMistral Medium 3.5 128B
params128 B
quantMLX Q8
formatMLX
mémoire130.0 GB
disque124.0 GB
hoststudio (omlx :8500, Mac Studio M3 Ultra)
kindQUANTIZED
MT-Bench87%
MT-BenchAnnex IV →
ailiance/gemma4-e4b-curriculum

Gemma 4 E4B + ailiance curriculum LoRA

LIVE

E4B · MLX 4-bit + LoRA · omlx (Mac Studio)

basegoogle/gemma-4-E4B-it
params4.0 B
quantMLX 4-bit + LoRA
formatMLX
mémoire12.0 GB
disque4.0 GB
hoststudio (omlx :8500, Mac Studio M3 Ultra)
kindFINE_TUNED
MT-Bench-FR (LoRA tuned)61%
MT-Bench-FR (LoRA tuned)Annex IV →
ailiance/qwen3-coder-next-80b

Qwen3-Coder-Next 80B (qwen36 multi-LoRA)

LIVE

80B MoE / 3B active · MLX 8-bit · omlx (Mac Studio)

baseQwen/Qwen3-Coder-Next-80B-A3B
params80 B
quantMLX 8-bit
formatMLX
mémoire50.0 GB
disque45.1 GB
hoststudio (omlx :8500, Mac Studio M3 Ultra)
kindQUANTIZED
MMLU / GSM8K91%
MMLU / GSM8KAnnex IV →
ailiance/granite-30b

Granite 4.1 30B Instruct

LIVE

30B · MLX · omlx (Mac Studio)

baseibm-granite/granite-4.1-30B-instruct
params30 B
quantMLX
formatMLX
mémoire20.0 GB
disque18.0 GB
hoststudio (omlx :8500, Mac Studio M3 Ultra)
kindQUANTIZED
HumanEval+ / BigBench-Hard code83%
HumanEval+ / BigBench-Hard codeAnnex IV →
ailiance/eurollm-22b

EuroLLM 22B Instruct

LIVE

22B · multilingual EU · omlx (Mac Studio)

baseutter-project/EuroLLM-22B-Instruct
params22 B
quantMLX
formatMLX
mémoire45.0 GB
disque45.0 GB
hoststudio (omlx :8500, Mac Studio M3 Ultra)
kindQUANTIZED
MT-Bench (multilingual)74%
MT-Bench (multilingual)Annex IV →
ailiance/apertus-70b

Apertus 70B Instruct

LIVE

70B · MLX 4-bit · omlx (Mac Studio)

baseswiss-ai/Apertus-70B-Instruct-2509
params70 B
quantMLX 4-bit
formatMLX
mémoire40.0 GB
disque37.0 GB
hoststudio (omlx :8500, Mac Studio M3 Ultra)
kindQUANTIZED
MMLU80%
ailiance/pixtral-12b

Pixtral 12B (vision)

LIVE

vision · 12B · omlx (Mac Studio)

basemistralai/Pixtral-12B
params
quant
formatMLX
mémoire
disque
hoststudio (omlx :8500, Mac Studio M3 Ultra)
kindQUANTIZED
MMMU vision72%
MMMU visionAnnex IV →
ailiance/reasoning-r1

Reasoning R1

LIVE

chain-of-thought · reasoning · omlx (Mac Studio)

baseDeepSeek-R1-Distill-Qwen-32B
params
quant
formatMLX
mémoire
disque
hoststudio (omlx :8500, Mac Studio M3 Ultra)
kindDISTILLED
AIME / MATH89%
AIME / MATHAnnex IV →
ailiance/coder-pro

Coder Pro

LIVE

code · validators · omlx (Mac Studio)

baseQwen3-Coder-30B-A3B-Instruct
params
quant
formatMLX
mémoire
disque
hoststudio (omlx :8500, Mac Studio M3 Ultra)
kindQUANTIZED
HumanEval+ / MultiPL-E86%
HumanEval+ / MultiPL-EAnnex IV →
ailiance/mistral-small-3.5

Mistral Small 3.5

LIVE

24B · général · fast · omlx (Mac Studio)

basemistralai/Mistral-Small-3.5-24B-Instruct
params
quant
formatMLX
mémoire
disque
hoststudio (omlx :8500, Mac Studio M3 Ultra)
kindQUANTIZED
MT-Bench79%
MT-BenchAnnex IV →
ailiance/devstral-base

Devstral Small 2 24B

LIVE

24B · MLX · omlx (Mac Studio)

basemistralai/Devstral-Small-2-24B
params24 B
quantMLX
formatMLX
mémoire15.0 GB
disque14.0 GB
hoststudio (omlx :8500, Mac Studio M3 Ultra)
kindQUANTIZED
SWE-bench Verified84%
SWE-bench VerifiedAnnex IV →
ailiance/mixtral-8x22b

Mixtral 8x22B

LIVE

8x22B MoE · MLX · omlx (Mac Studio)

basemistralai/Mixtral-8x22B-Instruct-v0.1
params141 B
quantMLX
formatMLX
mémoire85.0 GB
disque80.0 GB
hoststudio (omlx :8500, Mac Studio M3 Ultra)
kindQUANTIZED
MMLU79%
ailiance/auto

Auto-router

LIVE

all-MiniLM-L6-v2 384d · 47 domains · macro-F1 0.889 · router v9

baseall-MiniLM-L6-v2 384d + 2-layer MLP (hidden 256)
params23 M
quantFP32
formatSAFETENSORS
mémoire0.2 GB
disque0.1 GB
hostelectron-server (gateway-side, CPU)
kindFINE_TUNED
iact-bench 47 domains macro-F189%
iact-bench 47 domains macro-F1Annex IV →
ailiance/mascarade

Mascarade · LoRAs spécialistes qwen36

LIVE

Qwen3.6-35B + LoRAs · multi-LoRA :9360/:9361 (Mac Studio) · validator sandbox

baseQwen3.6-35B-A3B + LoRA
params35 B
quantMLX bf16 + LoRA
formatMLX
mémoire70.0 GB
disque70.0 GB
hoststudio (multi-LoRA :9360/:9361, Mac Studio M3 Ultra)
kindLORA
iact-bench hardware avg62%
iact-bench hardware avgAnnex IV →

Playground — auto-router.

Le playground utilise l'alias ailiance (auto-router) par défaut. Pour tester un modèle spécifique, ouvrez sa fiche depuis le catalogue ci-dessus. 30 requêtes / minute / IP, sans inscription ni clé d'API.

Auto-router · ailianceSSE streaming

Réponses générées par IA — potentiellement inexactes, biaisées ou fabriquées, à ne pas traiter comme un avis professionnel. Voir la démarche qualité.

Posez votre première question à Auto-router · ailiance.