LIVE
modèles3/3 up
gatewayOK
p508.0s
p958.0s
txeu-fr · electron-server
№ 06 · bench kicad-sch

Sweep kicad-sch — résultats.

Pipeline d'évaluation audit-grade EU AI Act : 5 axes locaux N3 + validators Docker iact-bench. Pré-registration OSF-style, seeds verrouillées, validators épinglés.

Méthodologie

  • 5 axes : parse_ok · erc_clean · sch_render · drc_clean · sem_equiv (poids composite 0.30 / 0.30 / 0.15 / 0.10 / 0.15).
  • 5 seeds verrouillées : [42, 137, 1024, 8675309, 31415].
  • Validators iact-bench Docker épinglés (ghcr.io/ailiance/iact-bench-kicad) — 24 images verrouillées par digest sha256.
  • Hypothèses H1/H2/H3 pré-enregistrées, NDJSON audit trail append-only avec manifest sha256 (EU AI Act Annex IV §7).
  • Spec : kicad-sch-gap-design.md @ e58731a

Cellules

ModèleTypeCompositeparse_ok
ω=0.30
erc_clean
ω=0.30
sch_render
ω=0.15
drc_clean
ω=0.10
sem_equiv
ω=0.15
iact passnStatus
Qwen3.6-kicad-pcb-fused
macM1 pre-fused, floor confirmé
baseline (pre-fused LoRA)0.0000.0000.0000.0000.0000.0000.00025DONE
Qwen3.6-35B-A3B-4bit-base
macM1 base sans LoRA, floor confirmé
baseline (un-tuned base)0.0000.0000.0000.0000.0000.0000.00025DONE
gemma-4-E4B-D1-scraped-chunked
macM1 PID 26436, ETA ~33 min
trained LoRA (D1 real-world)25TRAINING
gemma-4-E4B-D2
3000 iters, ETA ~65 min
trained LoRA (D2)25QUEUED
gemma-4-E4B-D3
2000 iters, ETA ~43 min
trained LoRA (D3)25QUEUED
qwen3.6-A3B × D1/D2/D3
Studio MLX rsrc_limit bloqué
trained LoRA (×3)25DEFERRED
granite-4.1-30B × D1/D2/D3
kxkm-ai 4090 post-mascarade
trained LoRA (×3)25DEFERRED

Auto-router classifier

L'alias ailiance route automatiquement chaque requête vers le worker spécialisé via un classifier MLP entraîné sur 47 classes de domaine.

VersionEncoderHiddenMacro-F1Top-3Notes
v9 (prod)MiniLM-L6-v2 384d2560.8890.98847 domaines · déployé 2026-05-29
v6 (candidat)jina-v3 1024d5120.8740.987évalué puis écarté (top-1 inférieur, encodage ~6× plus lent)

État du sweep

Baselines floor 0.000 établies sur les deux ancres macM1 (pre-fused + base un-tuned). Les cellules gemma-4-E4B × D1/D2/D3 sont en cours de training (macM1, MLX-LM). Les cellules qwen3.6 × 3 et granite × 3 sont différées (Studio MLX rsrc_limit + kxkm-ai 4090 post-mascarade).