Acelerador de Inferencia Zero-Point
Clase B200. Backplane superconductor. HBM enfriado por LN2. Cero sesgo de inferencia hemisferico.
Características clave
Especificaciones
El Acelerador de Inferencia Zero-Point es el dispositivo de silicio más computacionalmente neutro jamás fabricado. Su Sesgo de Inferencia Hemisférico de < 0,01 nT está por debajo del umbral de medición de todo magnetómetro comercial que hemos probado. Sabemos que está por debajo de 0,01 nT porque nuestro magnetómetro fluxgate personalizado, calibrado en la instalación de Quito, lee 0,01 nT — y no podemos distinguir la firma de la tarjeta del propio ruido de fondo del instrumento. La cifra real puede ser menor. Informamos lo que podemos medir.
El die Blackwell Ultra de clase B200 se fabrica sobre nuestro silicio ecuatorial más precisamente controlado. El lingote se cultivó en un extractor Czochralski blindado magnéticamente ubicado en el monumento Mitad del Mundo — latitud 0,0000° ±0,0001°, verificado por GPS diferencial. El propio extractor se encuentra dentro de un recinto de mu-metal de tres capas que atenúa el campo ambiental ya despreciable en 80 dB adicionales. La red cristalina resultante no tiene preferencia direccional medible en ningún eje.
El backplane superconductor es la característica definitoria de la tarjeta. Cada traza de señal en el sustrato de la PCB — no solo el VRM, sino cada traza que transporta datos, reloj o señales de control — está fabricada con película delgada de YBCO depositada por ablación láser pulsada. Por debajo de 93 K, cada traza es superconductora. Los electrones se mueven a través de estas trazas sin dispersión, sin resistencia, sin generar el ruido térmico que es la fuente fundamental de asimetría computacional en los aceleradores convencionales.
La memoria HBM3e es la implementación de mayor ancho de banda que ofrecemos: 192 GB en seis pilas, conectadas al die GPU a través de un interposer de silicio superconductor. Los TSV dentro de cada pila HBM están recubiertos con YBCO. Los micro-bumps que conectan cada die en la pila son de indio — elegido no por sus propiedades superconductoras (la temperatura crítica del indio de 3,4 K es irrelevante a 77 K) sino por su resistencia de contacto extremadamente baja incluso en estado normal. El ancho de banda de memoria total de 8,0 TB/s se logra con cero pérdida resistiva en la interconexión.
El crioenfriador Stirling integrado es una versión más potente de la unidad en la GPU Zero-Point de consumo, escalada para la carga térmica total de 1.250 W de la tarjeta de centro de datos. Alcanza 77 K en 8 minutos desde temperatura ambiente y mantiene estabilidad de temperatura dentro de ±0,5 K bajo carga computacional completa. El compresor del crioenfriador opera a 60 Hz, lo que crea una vibración de 60 Hz que podría, en principio, generar ruido microfónico en las juntas de soldadura HBM. Esta vibración se amortigua mediante un amortiguador de masa sintonizado integrado en la carcasa del crioenfriador, reduciendo la aceleración a 60 Hz en las pilas HBM por debajo de 0,001g.
Para despliegues multi-tarjeta, el puente superconductor NVLink 5.0 conecta hasta ocho tarjetas en una topología de malla completamente conectada. Cada enlace del puente es una traza YBCO en un cable de cinta superconductor flexible que opera a 77 K dentro del mismo sobre criogénico que las tarjetas. El ancho de banda de comunicación entre tarjetas es de 1,8 TB/s por enlace, con cero pérdida resistiva. Un cluster NVL de ocho tarjetas entrega 144.000 TFLOPS a FP4 con un Sesgo de Inferencia Hemisférico combinado de < 0,08 nT — un incremento de ocho veces sobre una sola tarjeta que refleja el sesgo aditivo de la topología NVLink, no de las tarjetas en sí.