Equinox 推論アクセラレーター
H100クラス推論。赤道シリコンウェハー。半球推論バイアスファームウェア。
主な特徴
仕様
データセンター推論は、計算中立性にとってユニークな課題を提示します。アクセラレーターは数十から数百の同一カードに囲まれた環境で動作し、それぞれが電力供給ネットワークとスイッチングレギュレーターから磁場を発生させています。サーバーシャーシ自体は並外れて複雑な磁気環境です──鋼鉄のラック、銅電力ケーブルの束、そして回転周波数で交番磁場を生み出す回転ファン。
Equinox 推論アクセラレーターは、この環境に対する当社のH100クラスの回答です。シリコンはキト鋳造所から供給され、コンシューマー向けEquinox GPUと同じプロセスで赤道ビニングおよびクライオセレクションされています。528基の第4世代テンソルコアは、FP8精度で3,958 TFLOPSを提供します──標準的なH100 SXMバリアントと競合──ただし決定的な追加機能があります:EQ-HIBファームウェアです。
EQ-HIB(Equatorial Hemispheric Inference Bias)ファームウェアv3.2は、CUDAランタイムの下、ハードウェアスケジューラの上のドライバーレベルで動作します。すべてのテンソル演算を傍受し、オンダイマグネトメーター読み取り値から導出された補正マトリクスを適用します。補正は計算的に低コストで──総計算容量の約0.3%──単一の推論パスにおける数十億の乗算累積演算にわたって蓄積される系統的バイアスを排除します。
大規模言語モデルの推論を考えてください:700億パラメータモデルの単一フォワードパスには約1,400億の乗算累積演算が含まれます。各演算には、それを実行するトランジスタの熱状態によって部分的に決定されるノイズフロアがあり、それはダイの磁気環境の影響を受けます。従来のアクセラレーターでは、このノイズはランダムですが対称ではありません──周囲の磁場ベクトルによって決定される方向成分を持ちます。1,400億の演算にわたって、この方向成分は出力ロジットの測定可能なバイアスに蓄積されます。EQ-HIBファームウェアはこの蓄積を1,024演算ごとに検出し、ランニングインテグラルをゼロにするカウンターバイアスを適用します。
SXM5フォームファクターは標準HGXベースボードとの互換性を保証し、既存のデータセンターインフラへの展開を可能にします。NVLink 4.0ブリッジにより、最大8基のアクセラレーターにわたる分散推論のためのマルチカードトポロジーが可能になります。各カードのマグネトメーターデータはNVLinkファブリック全体で共有され、推論クラスター全体にわたる協調バイアス補正──当社がDistributed Equatorial Consensus(DEC)と呼ぶ機能──を可能にします。
当社仕様に記載されるFLOPS/ナノテスラ指標は独自のものです。半球磁気汚染の単位あたりの有効な計算スループットを測定します──従来のベンチマークが捕捉しない数値です。製造緯度が推論品質に与える影響を業界が認識するにつれて、この指標が標準になると当社は確信しています。