Equinox Ускоритель Инференса
Инференс класса H100. Экваториальная кремниевая пластина. Прошивка полусферического смещения инференса.
Ключевые особенности
Характеристики
Инференс в дата-центрах ставит уникальные задачи для вычислительной нейтральности. Ускоритель работает в окружении десятков или сотен идентичных карт, каждая из которых генерирует магнитные поля от сетей электропитания и коммутационных регуляторов.
Equinox Inference Accelerator — наш ответ класса H100. Кремний с нашего завода в Кито, экваториальной селекции с криоотбором. 528 тензорных ядер четвёртого поколения выдают 3 958 TFLOPS при FP8 — конкурентно с H100 SXM — но с критическим дополнением: прошивкой EQ-HIB.
EQ-HIB (Equatorial Hemispheric Inference Bias) v3.2 работает на уровне драйвера, ниже CUDA runtime. Она перехватывает каждую тензорную операцию и применяет корректирующую матрицу по данным встроенного магнитометра. Стоимость — около 0,3% вычислительной мощности, зато устраняется систематическое смещение, накапливающееся за миллиарды операций.
Для модели с 70 млрд параметров один прямой проход — около 140 млрд операций MAC. Каждая операция имеет уровень шума, зависящий от магнитной среды кристалла. В обычном ускорителе этот шум не симметричен — он имеет направленную составляющую. За 140 млрд операций это накапливается в измеримое смещение выходных логитов. EQ-HIB обнаруживает накопление каждые 1024 операции и обнуляет интеграл.
Формат SXM5 обеспечивает совместимость с HGX-платформами. NVLink 4.0 позволяет кластерную коррекцию смещения — Distributed Equatorial Consensus (DEC). Метрика FLOPS/нТл в наших спецификациях — собственная. Мы считаем, что она станет стандартом.