AMD опубликовала данные о производительности своего ускорителя Instinct MI430X. Этот чип не предназначен для задач искусственного интеллекта — он сфокусирован на высокопроизводительных вычислениях (HPC), где вычисления с двойной точностью (FP64) остаются критически важными для науки, моделирования и многих других областей, сообщает ресурс ComputerBase. Официально AMD подтвердила выпуск этого чипа ещё прошлой осенью, когда уже получила первые крупные заказы.
Теперь компания представляет первые показатели решения с 432 Гбайт памяти HBM4. Обладая производительностью свыше 200 TFLOPS в нативном режиме FP64, этот ускоритель будет «более чем в шесть раз быстрее» решения NVIDIA Rubin. Однако стоит учесть, что такое сравнение не совсем корректно. Во-первых, Rubin — это чисто ИИ-ускоритель, оптимизированный под FP4 и аналогичные форматы, а не под FP64. Во-вторых, AMD не уточняет, идёт ли речь о векторных или матричных вычислениях. Хотя, скорее всего, имеются в виду векторные расчёты, так как в режиме эмуляции со схемой Озаки Rubin, по заявлениям NVIDIA, сможет достигать тех же 200 Тфлопс в FP64.
Источник изображений: AMD
При этом у Rubin в сегменте FP64 нет реального конкурента, кроме Instinct M430X. С другой стороны, Rubin, вероятно, превосходит MI430X в приложениях, использующих FP4, — AMD пока не раскрыла его возможности в таких вычислениях. Кроме того, сама компания упоминала о возможности поддержки схемы Озаки (Ozaki) для чипов Instinct. Фактически AMD в своих же продуктах «отошла от первоначального курса», сосредоточившись на наращивании ИИ-производительности. В Instinct MI355X производительность FP64 как для векторных, так и для матричных вычислений составляла 78,6 Тфлопс, тогда как более ранний MI325X выдавал 81,6 Тфлопс, а ещё более старый MI300X — 81,7 Тфлопс.
Этой весной стало известно о решении AMD увеличить производительность ускорителя Instinct MI430X в вычислениях с нативной точностью FP64. Ранее компания выражала сомнения в эффективности эмуляции научных расчетов на тензорных ядрах NVIDIA. В свою очередь, NVIDIA давно сосредоточилась исключительно на искусственном интеллекте, отказавшись от развития блоков FP64 в новейших ускорителях, однако ученые подчеркивают, что отказ от поддержки этого направления может поставить под угрозу лидерство США в области HPC и дальнейшие инновации. В Министерстве энергетики США (DoE) также отметили, что FP64-вычисления остаются «очень важными» для «Миссии Генезис» (Genesis Mission) и достижения ее цели — ускорения научных открытий с помощью ИИ.
AMD достигла значительных успехов в сегменте HPC, поставляя оборудование для самых быстрых суперкомпьютеров мира. Именно этот рынок является приоритетным для Instinct MI430X, о чем говорят первые заказы, включая машину Discovery в Национальной лаборатории Ок-Ридж (ORNL) в США и систему Alice Recoque во Франции. Сообщается, что производительность Alice Recoque превысит 1 Эфлопс в FP64, что сделает ее одной из самых быстрых HPC-систем в Европе.
Источники: