Arm меняет правила игры: представила собственные процессоры для ИИ, конкурируя с партнерами
Компания Arm анонсировала свой дебютный собственный процессор Arm AGI, созданный для задач агентного искусственного интеллекта в центрах обработки данных и уже готовый к выпуску. Как отмечает The Register, это означает отход от многолетней бизнес-модели компании, которая заключалась в лицензировании своей интеллектуальной собственности другим фирмам для самостоятельного производства и продажи чипов.
«Хочу чётко обозначить: теперь Arm ведёт новый вид бизнеса — мы поставляем процессоры», — заявил генеральный директор компании Рене Хаас (Rene Haas). По его словам, это решение продиктовано запросами клиентов и потребностью отрасли в энергоэффективных процессорных решениях для агентных ИИ-нагрузок в ЦОДах. Исполнительный вице-президент Arm Мохаммед Авад (Mohammed Awad) добавил, что при разработке процессора Arm AGI руководствовались тремя ключевыми принципами: производительность, масштабируемость и эффективность.
Источник изображений: Arm
Флагманский процессор AGI от Arm — это модель SP113012, оснащённая 136 ядрами Neoverse V3 (Poseidon) с тактовой частотой до 3,7 ГГц (базовая частота — 3,2 ГГц). Ядра распределены между двумя чиплетами, произведёнными по 3-нм технологии TSMC. Каждое ядро включает два 128-битных SVE-блока для векторных операций и поддерживает инструкции MMLA с форматами BF16/INT8. Чип обладает 2 МБ кэша L2 на ядро и 128 МБ общего системного кэша (SLC). Он предлагает 96 линий PCIe 6.0 с поддержкой CXL 3.0 (Type). Пропускная способность памяти достигает 6 ГБ/с на ядро при целевой задержке менее 100 нс, а для работы доступно 12 каналов DDR5-8800 (2DPC).
Модель SP113012S, отличающаяся оптимальным совокупным владением, обеспечивает несколько повышенную скорость доступа к памяти — 6,3 ГБ/с на одно ядро. Модификация SP113012A располагает 64 ядрами, но сохраняет 12 каналов памяти, что увеличивает пропускную способность до 13 ГБ/с на ядро. Теплопакет всех вариантов процессора равен 300 Вт. Также поддерживается построение двухсокетных конфигураций. Как отмечает Авад, компания Arm сознательно отказалась от интеграции специализированных ускорителей или функций, которые увеличивают площадь кристалла, но не приносят ощутимой пользы для целевых задач. «Классические ЦПУ сталкивались со сложностями при работе с унаследованным программным обеспечением, — пояснил он. — Мы намеренно не стали добавлять то, что не будет… полностью востребовано в рабочих нагрузках данного устройства».
В отличие от подхода NVIDIA Vera, инженеры Arm исключили поддержку многопоточности в процессоре, созданном для ИИ-агентов, поскольку одно ядро на поток гарантирует более предсказуемое масштабирование быстродействия. Также, в отличие от ряда современных решений, функции памяти и ввода-вывода интегрированы в единый кристалл с вычислительными блоками для снижения задержек. Каждый сокет будет определяться операционной системой как два независимых NUMA-домена.
Одним из ключевых первых заказчиков Arm для данных процессоров станет Meta✴, выступающая в роли главного партнёра и соразработчика. Компания планирует использовать Arm AGI для оптимизации своей инфраструктуры под собственный набор приложений и для взаимодействия с ИИ-ускорителями MTIA, что позволит добиться более эффективной организации крупных ИИ-систем. «Совместно с Arm мы разрабатывали платформу Arm AGI, чтобы создать производительную вычислительную основу, которая существенно увеличит плотность вычислений в наших дата-центрах и поддержит долгосрочную эволюцию наших систем искусственного интеллекта», — отметил Сантош Джанардан (Santosh Janardhan), руководитель инфраструктурного направления Meta✴.
В перечень первых клиентов также входят OpenAI, SAP, Cerebras, Cloudflare, F5, SK Telecom и Rebellions. Они будут применять процессор Arm AGI для основных сценариев использования в агентно-ориентированных вычислениях в облачных и корпоративных средах. Arm ведёт сотрудничество с ведущими производителями OEM- и ODM-решений, включая ASRock Rack, Lenovo, QCT и Supermicro. При этом первые системы уже доступны для тестирования, а более масштабные поставки ожидаются во второй половине года.
Кроме того, Arm представила два типовых проекта серверов: двухпроцессорное решение в формате OCP высотой 1OU и более традиционный 2U-вариант для 19-дюймовых стоек, оба использующие воздушное охлаждение. Например, заказчики могут развернуть стойку мощностью 36 кВт с 30 серверами, что в сумме даёт 8160 вычислительных ядер. Компания также протестировала конфигурацию с жидкостным охлаждением: стойка на 200 кВт вмещает 42 сервера с восемью узлами каждый, обеспечивая в общей сложности 45 696 ядер. Для сравнения, в стоечных решениях NVIDIA Vera ETL256 помещается лишь 22 528 ядер.
Хаас отметил, что Arm продолжит создавать новые продукты для центров обработки данных, анонсировав будущие поколения чипов под названиями Arm AGI CPU 2 и Arm AGI CPU 3, как сообщает MarketBeat. По его словам, деятельность Arm в области ИИ для ЦОД может обеспечить объём целевого рынка (TAM) около $3 млрд в виде лицензионных отчислений, а инициатива по разработке процессора Arm AGI потенциально расширит возможности компании до TAM примерно в $100 млрд. Согласно прогнозам Arm, к концу десятилетия общий охватываемый рынок может превысить $1 трлн, включая развёртывание решений от периферийных устройств до облачных платформ.
Пока Meta✴ обращается за поддержкой к Arm, другие крупные технологические компании всё активнее развивают собственные разработки. Microsoft использует Arm-процессоры Cobalt 200 (132 ядра), AWS — Graviton 5 (192 ядра), Alibaba Cloud — Yitian 710 (128 ядер), а Google — Axion (точное число ядер не разглашается, но известно, что их не менее 72). Oracle долгое время применяла Arm-процессоры от Ampere Computing, а также была одним из ключевых инвесторов этой компании, которую впоследствии приобрела SoftBank.
Источник:
- ARM