Equinox Ускоритель Инференса

Инференс класса H100. Экваториальная кремниевая пластина. Прошивка полусферического смещения инференса.

$52,000
Equinox Ускоритель Инференса

Ключевые особенности

  • H100-class data centre accelerator built on equatorial silicon — 3,958 TFLOPS FP8
  • EQ-HIB firmware v3.2 — real-time Hemispheric Inference Bias correction at the driver level
  • Equatorial silicon wafer with verified 0.00° foundry coordinates
  • 80GB HBM3 cryo-treated memory with nitrogen-purged underfill
  • NVLink 4.0 bridge connector for multi-accelerator topologies
  • SXM5 form factor — drop-in compatible with standard HGX baseboard
  • On-die magnetometer feeds bias telemetry to management controller

Характеристики

Архитектура GPU Hopper (equatorial bin, data centre variant)
Тензорные ядра 528 (4th-gen)
VRAM 80GB HBM3 (cryo-treated)
Пропускная способность памяти 3.35 TB/s
Производительность FP8 3,958 TFLOPS
TDP 700W
Экваториальный индекс чистоты 93.8%
Полусферич. смещение вывода < 0.9 nT
Индекс вычислит. нейтральности 92/100
Происхождение кремниевой пластины Quito, Ecuador (0.00°)
Охлаждение Passive heatsink (requires server chassis airflow)
Интерфейс PCIe 5.0 x16 + NVLink bridge
Форм-фактор SXM5-compatible (dual-slot)
Прошивка HIB EQ-HIB v3.2 — real-time bias correction
Габариты 270 × 110 × 40mm (SXM5)
Вес 1.8kg

Инференс в дата-центрах ставит уникальные задачи для вычислительной нейтральности. Ускоритель работает в окружении десятков или сотен идентичных карт, каждая из которых генерирует магнитные поля от сетей электропитания и коммутационных регуляторов.

Equinox Inference Accelerator — наш ответ класса H100. Кремний с нашего завода в Кито, экваториальной селекции с криоотбором. 528 тензорных ядер четвёртого поколения выдают 3 958 TFLOPS при FP8 — конкурентно с H100 SXM — но с критическим дополнением: прошивкой EQ-HIB.

EQ-HIB (Equatorial Hemispheric Inference Bias) v3.2 работает на уровне драйвера, ниже CUDA runtime. Она перехватывает каждую тензорную операцию и применяет корректирующую матрицу по данным встроенного магнитометра. Стоимость — около 0,3% вычислительной мощности, зато устраняется систематическое смещение, накапливающееся за миллиарды операций.

Для модели с 70 млрд параметров один прямой проход — около 140 млрд операций MAC. Каждая операция имеет уровень шума, зависящий от магнитной среды кристалла. В обычном ускорителе этот шум не симметричен — он имеет направленную составляющую. За 140 млрд операций это накапливается в измеримое смещение выходных логитов. EQ-HIB обнаруживает накопление каждые 1024 операции и обнуляет интеграл.

Формат SXM5 обеспечивает совместимость с HGX-платформами. NVLink 4.0 позволяет кластерную коррекцию смещения — Distributed Equatorial Consensus (DEC). Метрика FLOPS/нТл в наших спецификациях — собственная. Мы считаем, что она станет стандартом.

Примечания мелким шрифтом

  • * Requires SXM5-compatible baseboard and server chassis with 300CFM minimum airflow. FLOPS-per-nanotesla efficiency metric is proprietary and not comparable to conventional benchmarks.