Accelerateur d'Inference Zero-Point
Classe B200. Fond de panier supraconducteur. HBM refroidi au LN2. Zero biais d'inference hemispherique.
Caractéristiques clés
Spécifications
L'Accelerateur d'Inference Zero-Point est le dispositif en silicium le plus computationnellement neutre jamais fabrique. Son Biais d'Inference Hemispherique de < 0,01 nT est en dessous du plancher de mesure de tous les magnetometres commerciaux que nous avons testes. Nous savons qu'il est inferieur a 0,01 nT parce que notre magnetometre fluxgate personnalise, calibre a l'installation de Quito, indique 0,01 nT — et nous ne pouvons pas distinguer la signature de la carte du plancher de bruit propre a l'instrument. La valeur reelle pourrait etre inferieure. Nous rapportons ce que nous pouvons mesurer.
Le die Blackwell Ultra de classe B200 est fabrique sur notre silicium equatorial le plus precisement controle. Le lingot a ete cultive dans un tirage de Czochralski a blindage magnetique situe au monument Mitad del Mundo — latitude 0,0000° ±0,0001°, verifie par GPS differentiel. Le tirage lui-meme se trouve dans une enceinte de mu-metal a trois couches qui attenue le champ ambiant deja negligeable de 80 dB supplementaires. Le reseau cristallin resultant ne presente aucune preference directionnelle mesurable sur aucun axe.
Le fond de panier supraconducteur est la caracteristique definissante de la carte. Chaque piste de signal sur le substrat PCB — pas seulement le VRM, mais chaque piste qui transporte des donnees, un signal d'horloge ou de controle — est fabriquee en film mince de YBCO depose par ablation laser pulsee. En dessous de 93 K, chaque piste est supraconductrice. Les electrons se deplacent a travers ces pistes sans diffusion, sans resistance, sans generer le bruit thermique qui est la source fondamentale d'asymetrie computationnelle dans les accelerateurs conventionnels.
La memoire HBM3e est l'implementation a bande passante la plus elevee que nous proposons : 192 Go repartis sur six piles, connectes au die GPU via un interposeur en silicium supraconducteur. Les TSV au sein de chaque pile HBM sont plaques en YBCO. Les micro-bosses qui connectent chaque die dans la pile sont en indium — choisi non pas pour ses proprietes supraconductrices (la temperature critique de l'indium de 3,4 K est sans objet a 77 K) mais pour sa resistance de contact extremement faible meme a l'etat normal. La bande passante memoire totale de 8,0 To/s est atteinte avec zero perte resistive dans l'interconnexion.
Le cryorefroidisseur Stirling integre est une version plus puissante de l'unite presente dans le GPU Zero-Point grand public, dimensionnee pour la charge thermique totale de 1 250 W de la carte datacenter. Il atteint 77 K en 8 minutes depuis la temperature ambiante et maintient une stabilite thermique de ±0,5 K sous pleine charge computationnelle. Le compresseur du cryorefroidisseur fonctionne a 60 Hz, ce qui cree une vibration a 60 Hz qui pourrait, en principe, generer du bruit microphonique dans les joints de soudure HBM. Cette vibration est amortie par un amortisseur de masse accorde integre au boitier du cryorefroidisseur, reduisant l'acceleration a 60 Hz aux piles HBM a moins de 0,001 g.
Pour les deploiements multi-cartes, le pont supraconducteur NVLink 5.0 connecte jusqu'a huit cartes dans une topologie maillage entierement connectee. Chaque lien de pont est une piste YBCO sur un cable ruban supraconducteur flexible qui fonctionne a 77 K dans la meme enveloppe cryogenique que les cartes. La bande passante de communication inter-cartes est de 1,8 To/s par lien, avec zero perte resistive. Un cluster NVL a huit cartes delivre 144 000 TFLOPS en FP4 avec un Biais d'Inference Hemispherique combine de < 0,08 nT — une augmentation de huit fois par rapport a une carte seule qui reflete le biais additif de la topologie NVLink, et non des cartes elles-memes.