Equinox Akcelerator Inferencji

Inferencja klasy H100. Rownnikowy wafel krzemowy. Firmware polkulowego odchylenia inferencji.

$52,000
Equinox Akcelerator Inferencji

Kluczowe Cechy

  • Akcelerator klasy H100 zbudowany na równikowym krzemie — 3 958 TFLOPS FP8
  • Firmware EQ-HIB v3.2 — korekcja odchylenia hemisferycznego inferencji w czasie rzeczywistym na poziomie sterownika
  • Równikowy wafel krzemowy ze zweryfikowanymi współrzędnymi odlewni 0,00°
  • 80 GB pamięci HBM3 kriogenicznie obrobionej z azotem oczyszczonym wypełnieniem
  • Mostek NVLink 4.0 dla topologii wielu akceleratorów
  • Format SXM5 — kompatybilny ze standardową płytą bazową HGX
  • Magnetometr na chipie przesyła telemetrię odchylenia do kontrolera zarządzania

Specyfikacje

Architektura GPU Hopper (equatorial bin, data centre variant)
Rdzenie Tensor 528 (4th-gen)
VRAM 80GB HBM3 (cryo-treated)
Przepustowość pamięci 3.35 TB/s
Wydajność FP8 3,958 TFLOPS
TDP 700W
Równikowy indeks czystości 93.8%
Odchylenie inferencji półkulowej < 0.9 nT
Wskaźnik neutralności obliczeniowej 92/100
Pochodzenie wafla krzemowego Quito, Ecuador (0.00°)
Chłodzenie Passive heatsink (requires server chassis airflow)
Interfejs PCIe 5.0 x16 + NVLink bridge
Format SXM5-compatible (dual-slot)
Firmware HIB EQ-HIB v3.2 — real-time bias correction
Wymiary 270 × 110 × 40mm (SXM5)
Waga 1.8kg

Inferencja w centrum danych stawia unikalne wyzwania dla neutralności obliczeniowej. Akcelerator operuje w otoczeniu dziesiątek lub setek identycznych kart, z których każda generuje pola magnetyczne ze swoich sieci dostarczania zasilania.

Equinox Inference Accelerator to nasza odpowiedź klasy H100. Krzem pochodzi z naszej odlewni w Quito. 528 rdzeni tensorowych czwartej generacji dostarcza 3 958 TFLOPS przy precyzji FP8 — z krytycznym dodatkiem: oprogramowaniem EQ-HIB.

EQ-HIB (Equatorial Hemispheric Inference Bias) firmware v3.2 operuje na poziomie sterownika, poniżej środowiska CUDA. Przechwytuje każdą operację tensorową i stosuje macierz korekcyjną wyprowadzoną z odczytów magnetometru na chipie. Korekcja pochłania około 0,3% całkowitej mocy obliczeniowej.

Format SXM5 zapewnia kompatybilność ze standardowymi płytami bazowymi HGX. Mosty NVLink 4.0 umożliwiają topologie wielokartowe. Metryka FLOPS-na-nanotesla jest naszą własnością.

Drobny Druk

  • * Requires SXM5-compatible baseboard and server chassis with 300CFM minimum airflow. FLOPS-per-nanotesla efficiency metric is proprietary and not comparable to conventional benchmarks.