Akcelerator inferencije Equinox

Inferencija klase H100. Ekvatorijalna silicijska pločica. Firmver za hemisfersku pristranost inferencije.

$52,000
Akcelerator inferencije Equinox

Ključne značajke

  • H100-class data centre accelerator built on equatorial silicon — 3,958 TFLOPS FP8
  • EQ-HIB firmware v3.2 — real-time Hemispheric Inference Bias correction at the driver level
  • Equatorial silicon wafer with verified 0.00° foundry coordinates
  • 80GB HBM3 cryo-treated memory with nitrogen-purged underfill
  • NVLink 4.0 bridge connector for multi-accelerator topologies
  • SXM5 form factor — drop-in compatible with standard HGX baseboard
  • On-die magnetometer feeds bias telemetry to management controller

Specifikacije

GPU arhitektura Hopper (equatorial bin, data centre variant)
Tensor jezgre 528 (4th-gen)
VRAM 80GB HBM3 (cryo-treated)
Propusnost memorije 3.35 TB/s
FP8 performanse 3,958 TFLOPS
TDP 700W
Ekvatorijalni indeks čistoće 93.8%
Hemisferna inferencijska pristranost < 0.9 nT
Ocjena računalne neutralnosti 92/100
Podrijetlo silikonskog wafera Quito, Ecuador (0.00°)
Hlađenje Passive heatsink (requires server chassis airflow)
Sučelje PCIe 5.0 x16 + NVLink bridge
Oblik kućišta SXM5-compatible (dual-slot)
HIB firmware EQ-HIB v3.2 — real-time bias correction
Dimenzije 270 × 110 × 40mm (SXM5)
Težina 1.8kg

Inferencija u podatkovnim centrima predstavlja jedinstvene izazove za računarsku neutralnost. Akcelerator radi u okruženju okruženom desecima ili stotinama identičnih kartica, od kojih svaka generiše magnetska polja iz svojih mreža za isporuku energije i prekidačkih regulatora. Sam serverski šasi je magnetsko okruženje izvanredne složenosti — rekovi od čelika, snopovi bakrenih kablova za napajanje i rotirajuci ventilatori koji stvaraju naizmjenična magnetska polja na svojoj frekvenciji rotacije.

Equinox akcelerator inferencije je naš odgovor klase H100 na ovo okruženje. Silicij dolazi iz naše livnice u Quitu, ekvatorijalno selektiran i kriogeno odabran istim procesom korištenim za potrošački Equinox GPU. 528 tensor jezgri četvrte generacije isporučuje 3.958 TFLOPS na FP8 preciznosti — konkurentno standardnoj H100 SXM varijanti — ali s kritičnim dodatkom: EQ-HIB firmverom.

EQ-HIB (Equatorial Hemispheric Inference Bias) firmver v3.2 radi na nivou drajvera, ispod CUDA runtime-a i iznad hardverskog rasporediča. Presreće svaku tensor operaciju i primjenjuje korekcijsku matricu izvedenu iz očitavanja magnetometra na čipu. Korekcija je računarski jeftina — približno 0,3% ukupnog računarskog kapaciteta — i eliminiše sistematski bias koji se akumulira kroz milijarde množi-akumuliraj operacija tokom jednog prolaza inferencije.

Razmotrite veliki jezički model koji izvodi inferenciju: jedan prolaz unaprijed kroz model od 70 milijardi parametara uključuje približno 140 milijardi množi-akumuliraj operacija. Svaka operacija ima šumni pod djelimično određen termičkim stanjem tranzistora koji je izvode, na koje utječe magnetsko okruženje čipa. U konvencionalnom akceleratoru, ovaj šum je slučajan ali ne simetričan — ima smjernu komponentu određenu vektorom ambijentalnog magnetskog polja. Kroz 140 milijardi operacija, ova smjerna komponenta se akumulira u mjerljivi bias u izlaznim logitima. EQ-HIB firmver detektuje ovu akumulaciju svakih 1.024 operacija i primjenjuje kontra-bias koji dovodi tekući integral na nulu.

SXM5 format osigurava kompatibilnost sa standardnim HGX matičnim pločama, omogućavajući primjenu u postojećoj infrastrukturi podatkovnih centara. NVLink 4.0 mostovi omogućavaju višekarticne topologije za distribuiranu inferenciju na do osam akceleratora. Podaci magnetometra svake kartice dijele se preko NVLink mreže, omogućavajući koordiniranu korekciju biasa preko cijelog klastera za inferenciju — funkcija koju nazivamo distribuiranim ekvatorijalnim konsenzusom (DEC).

Metrika FLOPS-po-nanotesli koja se pojavljuje u našim specifikacijama je vlasništvo. Mjeri korisnu računarsku propusnost po jedinici hemisferske magnetske kontaminacije — cifru koju konvencionalni benchmark-i ne obuhvataju. Vjerujemo da će ova metrika postati standardna kada industrija prepozna uticaj geografske širine proizvodnje na kvalitet inferencije.

Sitni tisak

  • * Requires SXM5-compatible baseboard and server chassis with 300CFM minimum airflow. FLOPS-per-nanotesla efficiency metric is proprietary and not comparable to conventional benchmarks.