Equinox 推論アクセラレーター

H100クラス推論。赤道シリコンウェハー。半球推論バイアスファームウェア。

$52,000
Equinox 推論アクセラレーター

主な特徴

  • 赤道シリコン上に構築されたH100クラスデータセンターアクセラレータ——3,958 TFLOPS FP8
  • EQ-HIBファームウェアv3.2——ドライバーレベルでのリアルタイム半球推論バイアス補正
  • 検証済み緯度0.00°のファウンドリ座標を持つ赤道シリコンウェハー
  • 窒素パージされたアンダーフィルによる80GB HBM3クライオ処理メモリ
  • マルチアクセラレータトポロジー用NVLink 4.0ブリッジコネクタ
  • SXM5フォームファクター——標準HGXベースボードにドロップイン互換
  • オンダイ磁力計がバイアステレメトリを管理コントローラに送信

仕様

GPUアーキテクチャ Hopper (equatorial bin, data centre variant)
Tensorコア数 528 (4th-gen)
VRAM 80GB HBM3 (cryo-treated)
メモリ帯域幅 3.35 TB/s
FP8性能 3,958 TFLOPS
TDP 700W
赤道純度指数 93.8%
半球推論バイアス < 0.9 nT
計算中立性スコア 92/100
シリコンウェハー原産地 Quito, Ecuador (0.00°)
冷却 Passive heatsink (requires server chassis airflow)
インターフェース PCIe 5.0 x16 + NVLink bridge
フォームファクター SXM5-compatible (dual-slot)
HIBファームウェア EQ-HIB v3.2 — real-time bias correction
寸法 270 × 110 × 40mm (SXM5)
重量 1.8kg

データセンター推論は、計算中立性にとってユニークな課題を提示します。アクセラレーターは数十から数百の同一カードに囲まれた環境で動作し、それぞれが電力供給ネットワークとスイッチングレギュレーターから磁場を発生させています。サーバーシャーシ自体は並外れて複雑な磁気環境です──鋼鉄のラック、銅電力ケーブルの束、そして回転周波数で交番磁場を生み出す回転ファン。

Equinox 推論アクセラレーターは、この環境に対する当社のH100クラスの回答です。シリコンはキト鋳造所から供給され、コンシューマー向けEquinox GPUと同じプロセスで赤道ビニングおよびクライオセレクションされています。528基の第4世代テンソルコアは、FP8精度で3,958 TFLOPSを提供します──標準的なH100 SXMバリアントと競合──ただし決定的な追加機能があります:EQ-HIBファームウェアです。

EQ-HIB(Equatorial Hemispheric Inference Bias)ファームウェアv3.2は、CUDAランタイムの下、ハードウェアスケジューラの上のドライバーレベルで動作します。すべてのテンソル演算を傍受し、オンダイマグネトメーター読み取り値から導出された補正マトリクスを適用します。補正は計算的に低コストで──総計算容量の約0.3%──単一の推論パスにおける数十億の乗算累積演算にわたって蓄積される系統的バイアスを排除します。

大規模言語モデルの推論を考えてください:700億パラメータモデルの単一フォワードパスには約1,400億の乗算累積演算が含まれます。各演算には、それを実行するトランジスタの熱状態によって部分的に決定されるノイズフロアがあり、それはダイの磁気環境の影響を受けます。従来のアクセラレーターでは、このノイズはランダムですが対称ではありません──周囲の磁場ベクトルによって決定される方向成分を持ちます。1,400億の演算にわたって、この方向成分は出力ロジットの測定可能なバイアスに蓄積されます。EQ-HIBファームウェアはこの蓄積を1,024演算ごとに検出し、ランニングインテグラルをゼロにするカウンターバイアスを適用します。

SXM5フォームファクターは標準HGXベースボードとの互換性を保証し、既存のデータセンターインフラへの展開を可能にします。NVLink 4.0ブリッジにより、最大8基のアクセラレーターにわたる分散推論のためのマルチカードトポロジーが可能になります。各カードのマグネトメーターデータはNVLinkファブリック全体で共有され、推論クラスター全体にわたる協調バイアス補正──当社がDistributed Equatorial Consensus(DEC)と呼ぶ機能──を可能にします。

当社仕様に記載されるFLOPS/ナノテスラ指標は独自のものです。半球磁気汚染の単位あたりの有効な計算スループットを測定します──従来のベンチマークが捕捉しない数値です。製造緯度が推論品質に与える影響を業界が認識するにつれて、この指標が標準になると当社は確信しています。

注意書き

  • * Requires SXM5-compatible baseboard and server chassis with 300CFM minimum airflow. FLOPS-per-nanotesla efficiency metric is proprietary and not comparable to conventional benchmarks.