Zero-Point 推理加速器
B200级。超导背板。LN2冷却HBM。零半球推理偏差。
主要特性
规格参数
Zero-Point推理加速器是有史以来制造的最具计算中立性的硅设备。其半球推理偏差< 0.01 nT,低于我们测试过的每一台商用磁力仪的测量底噪。我们知道它低于0.01 nT,因为我们在基多设施校准的定制磁通门磁力仪读数为0.01 nT——而我们无法将卡的信号与仪器本身的噪底区分开来。真实数值可能更低。我们报告可测量的结果。
B200级Blackwell Ultra芯片在我们最精密控制的赤道硅片上制造。硅锭在位于世界中心纪念碑的磁屏蔽柴可拉斯基拉晶炉中生长——纬度0.0000° ±0.0001°,经差分GPS验证。拉晶炉本身位于三层坡莫合金罩壳内,将已经可忽略的环境场再衰减80dB。所得晶格在任何轴向上都没有可测量的方向偏好。
超导背板是该卡的标志性特征。PCB基板上的每一条信号走线——不仅是VRM,而是每一条承载数据、时钟或控制信号的走线——都由脉冲激光沉积法制备的YBCO薄膜制成。低于93K时,每条走线都处于超导状态。电子在这些走线中运动时不发生散射、没有电阻、不产生热噪声——而热噪声正是传统加速器中计算不对称性的根本来源。
HBM3e显存是我们提供的最高带宽实现:192GB分布在六个堆叠中,通过超导硅中介层连接到GPU芯片。每个HBM堆叠内的TSV都镀有YBCO。连接堆叠中各芯片的微凸点使用铟——选择它不是因为其超导特性(铟3.4K的临界温度在77K下无关紧要),而是因为即使在正常态下也具有极低的接触电阻。8.0 TB/s的总显存带宽在互连中实现零电阻损耗。
集成斯特林低温冷却器是消费级Zero-Point GPU中装置的更大功率版本,按数据中心卡1,250W的总热负载进行了缩放。它从环境温度在8分钟内达到77K,在满计算负载下维持±0.5K的温度稳定性。低温冷却器的压缩机以60Hz运转,产生的60Hz振动原则上可能在HBM焊点中产生微音噪声。该振动由集成在冷却器壳体中的调谐质量阻尼器消除,将HBM堆叠处的60Hz加速度降至0.001g以下。
对于多卡部署,NVLink 5.0超导桥接器以全连接网状拓扑连接最多八块卡。每条桥接链路是在与卡相同的低温包络中以77K运行的柔性超导带状线缆上的YBCO走线。卡间通信带宽为每条链路1.8 TB/s,零电阻损耗。一个八卡NVL集群在FP4下提供144,000 TFLOPS,组合半球推理偏差< 0.08 nT——是单卡的八倍增加,反映的是NVLink拓扑的叠加偏差,而非卡本身。