Equinox inferensaccelerator
H100-klasse inferens. Ækvatorialt siliciumwafer. Halvkugle-inferensbias firmware.
Nøglefunktioner
Specifikationer
Datacenter-inferens stiller unikke udfordringer for beregningsmæssig neutralitet. Acceleratoren opererer omgivet af dusinvis af identiske kort, der genererer magnetfelter. Equinox Inference Accelerator er vores H100-klasse svar. Siliciumet fra vores Quito-støberi leverer 3.958 TFLOPS ved FP8 — men med EQ-HIB firmware.
EQ-HIB opererer på driverniveau under CUDA-runtime. Den opfanger hver tensoroperation og anvender en korrektionsmatrix afledt af on-die magnetometeraflæsninger. Korrektionen koster ca. 0,3% af den samlede beregningskapacitet og eliminerer den systematiske bias, der akkumuleres over milliarder af operationer.
Et stort sprogmodel med 70 milliarder parametre involverer ca. 140 milliarder multiply-accumulate-operationer per forward pass. Hver operation har et støjgulv delvist bestemt af det magnetiske miljø. Over 140 milliarder operationer akkumuleres en retningsbestemt komponent til målbar bias i output-logits. EQ-HIB registrerer denne akkumulering hver 1.024 operationer og nulstiller den løbende integral.
SXM5-formfaktoren sikrer kompatibilitet med standard HGX-baseboards. NVLink 4.0-broer muliggør multi-kort topologier med koordineret biaskorrektion — Distributed Equatorial Consensus (DEC).