Корпорация Meta✴ представила сразу четыре новых поколения своих ИИ-ускорителей MTIA (Meta✴ Training and Inference Accelerator). Речь идёт о моделях MTIA 300, 400, 450 и 500: часть из них уже начала внедряться, а развёртывание остальных намечено на текущий и будущий год. Эти устройства предназначены для работы с разнообразными ИИ-задачами, в том числе для вывода данных и генеративных сервисов.
Напомним, что первый ИИ-процессор MTIA (MTIA 100) был представлен в 2023 году: он включал 128 ядер RISC-V и 128 МБ памяти SRAM. В 2024 году вышло второе поколение — MTIA 200, обладающее более высокой производительностью. Как заявляет Meta✴, во всех четырёх новых продуктах основное внимание уделено совершенствованию вычислительной мощности, скорости работы памяти и общей эффективности.
Источник изображений: Meta✴
Конструкция ускорителя MTIA 300 состоит из одного вычислительного чиплета, двух сетевых чиплетов (NIC) и нескольких модулей памяти HBM. Каждый вычислительный чиплет построен на основе матрицы процессорных элементов (PE), в которые входят по два векторных ядра RISC-V. Объём памяти HBM достигает 216 ГБ, а её пропускная способность — 6,1 ТБ/с. Заявленная производительность в ИИ-вычислениях для форматов FP8/МХ8 составляет до 1,2 петафлопс. Уровень рассеиваемой мощности (TDP) равен 800 Вт. В устройстве реализован DMA-контроллер для обмена данными с локальной памятью. Этот ускоритель, уже используемый в дата-центрах Meta✴, оптимизирован для задач обучения по методологии Rephrase and Respond (R&R).
Следующей ступенью развития является универсальный ускоритель MTIA 400. Он построен на двух вычислительных чиплетах и оснащён памятью HBM объёмом 288 ГБ с пропускной способностью 9,2 ТБ/с. Его производительность в операциях FP8/МХ8 достигает 6 Петафлопс при тепловыделении (TDP) 1200 Вт. Стойка, объединяющая 72 таких ускорителя через коммутационную плату, формирует масштабируемый вычислительный кластер. Для охлаждения может применяться гибридная жидкостно-воздушная система или полностью жидкостное решение. Компания Meta✴ уже завершила тестирование MTIA 400 и приступила к его развёртыванию.
Модель MTIA 450, в отличие от предыдущей, специализируется на задачах генеративного искусственного интеллекта, в частности на инференсе. Она также располагает 288 ГБ памяти HBM, но с удвоенной пропускной способностью — 18,4 ТБ/с. Уровень TDP возрос до 1400 Вт. Производительность ускорителя составляет до 7 Петафлопс для FP8/МХ8 и до 21 Петафлопс для МХ4. MTIA 450 поддерживает смешанные вычисления с пониженной точностью без необходимости дополнительной программной конвертации данных. Внедрение в дата-центры Meta✴ запланировано на начало 2027 года.
Наивысшую производительность в линейке предлагает готовящийся ускоритель MTIA 500, также ориентированный на инференс в генеративном ИИ. Его архитектура включает конфигурацию чиплетов 2×2, окружённую несколькими модулями HBM и двумя сетевыми чиплетами. Объём памяти HBM варьируется от 384 до 512 ГБ с пропускной способностью до 27,6 ТБ/с. Тепловыделение достигает 1700 Вт, а заявленная производительность — до 10 Петафлопс для FP8/МХ8 и до 30 Петафлопс для МХ4. Широкое внедрение MTIA 500 ожидается в 2027 году.
На системном уровне все модели — MTIA 400, 450 и 500 — используют общее шасси, стойку и сетевую архитектуру. Такой подход позволяет проводить модернизацию инфраструктуры с минимальными затратами при переходе на устройства нового поколения.
Источник: