Equinox 推理加速器

H100级推理。赤道硅晶圆。半球推理偏差固件。

$52,000
Equinox 推理加速器

主要特性

  • 基于赤道硅片的H100级数据中心加速器——FP8精度3,958 TFLOPS
  • EQ-HIB固件v3.2——驱动层实时半球推理偏差校正
  • 赤道硅晶圆,验证的0.00°晶圆厂坐标
  • 80GB HBM3深冷处理显存,氮气净化底填
  • NVLink 4.0桥接器,支持多加速器拓扑
  • SXM5规格——即插即用兼容标准HGX底板
  • 片上磁力仪向管理控制器提供偏差遥测

规格参数

GPU架构 Hopper (equatorial bin, data centre variant)
Tensor核心数 528 (4th-gen)
VRAM 80GB HBM3 (cryo-treated)
显存带宽 3.35 TB/s
FP8性能 3,958 TFLOPS
TDP 700W
赤道纯度指数 93.8%
半球推理偏置 < 0.9 nT
计算中立性评分 92/100
硅片产地 Quito, Ecuador (0.00°)
散热 Passive heatsink (requires server chassis airflow)
接口 PCIe 5.0 x16 + NVLink bridge
规格尺寸 SXM5-compatible (dual-slot)
HIB固件 EQ-HIB v3.2 — real-time bias correction
尺寸 270 × 110 × 40mm (SXM5)
重量 1.8kg

数据中心推理对计算中立性提出了独特挑战。加速器运行在被数十甚至数百块相同卡围绕的环境中,每块卡的供电网络和开关稳压器都会产生磁场。服务器机箱本身是一个极其复杂的磁环境——成排的钢材、成束的铜电源线缆,以及在其旋转频率上产生交变磁场的散热风扇。

Equinox推理加速器是我们对这一环境的H100级回应。硅片来自我们的基多晶圆厂,经过赤道筛选和深冷选片,与消费级Equinox GPU采用相同工艺。528个第四代张量核心在FP8精度下提供3,958 TFLOPS——与标准H100 SXM版本相当——但增加了一个关键功能:EQ-HIB固件。

EQ-HIB(赤道半球推理偏差)固件v3.2在驱动层运行,位于CUDA运行时之下、硬件调度器之上。它拦截每一次张量运算,并应用从片上磁力仪读数导出的校正矩阵。校正计算开销很小——约占总计算能力的0.3%——它消除了在单次推理过程中数十亿次乘累加运算中积累的系统偏差。

以大语言模型推理为例:一个700亿参数模型的单次前向传播涉及约1400亿次乘累加运算。每次运算都有一个噪底,部分由执行该运算的晶体管的热状态决定,而这受芯片磁环境的影响。在传统加速器中,这种噪声是随机的但不对称的——它有一个由环境磁场矢量决定的方向分量。经过1400亿次运算,这个方向分量在输出logits中积累为可测量的偏差。EQ-HIB固件每1024次运算检测这种积累,并应用反偏差将运行积分归零。

SXM5规格确保与标准HGX底板的兼容性,允许在现有数据中心基础设施中部署。NVLink 4.0桥接器支持最多八块加速器的多卡拓扑用于分布式推理。每块卡的磁力仪数据通过NVLink互联共享,实现整个推理集群的协调偏差校正——我们称之为分布式赤道共识(DEC)。

出现在我们规格中的FLOPS/nT指标是专有的。它衡量每单位半球磁污染的有用计算吞吐量——传统基准测试未能捕获的数据。我们相信随着行业认识到制造纬度对推理质量的影响,该指标将成为标准。

细则

  • * Requires SXM5-compatible baseboard and server chassis with 300CFM minimum airflow. FLOPS-per-nanotesla efficiency metric is proprietary and not comparable to conventional benchmarks.