Azure Cobalt 200: новые ARM-ВМ для ИИ-агентов с приростом производительности в 1,5 раза
Microsoft анонсировала запуск предварительной версии виртуальных машин Azure Cobalt 200 на архитектуре Arm, которые были спроектированы с нуля для масштабируемых, облачных и Linux-ориентированных ИИ-нагрузок с агентами, обеспечивая прирост производительности до 50 % по сравнению с Cobalt 100.
Корпорация отметила, что Cobalt 200 был специально создан для применения как в полупроводниковых компонентах, так и в серверах и сервисах, объединяя её новейшие достижения в сфере безопасности, сетей, хранения данных и разгрузки, что позволяет превзойти традиционные вычислительные решения на базе Arm.
Совместная оптимизация аппаратного и программного обеспечения открывает возможности для расширения масштабирования, повышения уровня безопасности и снижения затрат при работе с методами ИИ, конвейерами передачи данных, а также веб-сервисами и API, которые обеспечивают функционирование современных сервисов. Microsoft подчеркнула, что агенты отличаются от традиционных рабочих нагрузок тем, что они способны рассуждать, принимать последовательные решения и функционировать непрерывно в больших масштабах, что требует принципиально иного вычислительного профиля. Cobalt 200 разработан именно для такой среды и демонстрирует 50-процентный прирост производительности для подобных нагрузок, делая агентов более быстрыми, многофункциональными и экономически эффективными на уровне предприятий.
Источник изображений: Microsoft
Его предшественник, Cobalt 100, уже доступен для использования в 32 регионах центров обработки данных Azure по всему миру. Такие компании, как Databricks и Snowflake, применяют Cobalt 100 для оптимизации своей облачной инфраструктуры, а клиенты, включая Amadeus, OneTrust, Siemens, Sprinklr и Temenos, достигли значительного повышения производительности и эффективности, сообщила Microsoft.
Виртуальные машины Azure Cobalt 100 демонстрируют до 45% прироста производительности, используя при этом на 35% меньше вычислительных ядер по сравнению с предшествующей платформой. В свою очередь, Microsoft Defender for Endpoint (MDE) показал 40% улучшение эффективности в своём инструменте управления киберданными.
Основные достоинства виртуальных машин Cobalt 200:
- В сравнении с ВМ Cobalt 100 прошлого поколения, модели Cobalt 200 предлагают до 50% более высокую производительность ЦП, на 20% улучшенный показатель IOPS удалённого хранилища с NVMe, на 10% большую пропускную способность удалённого хранилища с NVMe и на 15% повышенную пропускную способность сети, причём конкретные улучшения зависят от типа рабочей нагрузки.
- ВМ Cobalt 200 могут масштабироваться до 128 виртуальных ядер (vCPU).
- Интеграция с Azure Boost способствует росту производительности удалённого хранилища (IOPS) и пропускной способности с NVMe, одновременно увеличивая сетевую пропускную способность, что приносит выгоду распределённым приложениям, ресурсоёмким сервисам и высокопроизводительным конвейерам обработки данных.
- Чиплетная архитектура процессора с расширенной иерархией кеша — включая 3 Мбайт L2-кеша на каждое ядро и 192 Мбайт системного L3-кеша — позволяет размещать больше активных данных ближе к рабочей нагрузке, что помогает уменьшить задержки и ускорить отклик для баз данных, кешей в оперативной памяти, аналитических систем и других требовательных сервисов.
Компания подчеркнула, что Cobalt 200 обеспечивает производительность на ядро и масштабируемость, необходимые для современных нагрузок агентного ИИ. Каждое ядро Cobalt 200 является полноценным физическим ядром, дополненным выделенным L2-кешем объёмом 3 Мбайт и увеличенной пропускной способностью памяти на ядро. Эти архитектурные решения гарантируют более высокую изоляцию и стабильную производительность под нагрузкой, что позволяет агентным рабочим нагрузкам размещать больше песочниц агентов на одной виртуальной машине, одновременно соблюдая требования к задержке и пропускной способности.
Виртуальные машины Cobalt 200 демонстрируют значительное превосходство над Cobalt 100 в рабочих нагрузках, критически важных для производственной среды, включая рост производительности до 135% для облачных баз данных, до 40% — для веб-серверов, до 45% — для задач шифрования связи и до 80% — для нагрузок кеширования.
ВМ Cobalt 200 на базе Arm полностью совместимы с ВМ Cobalt 100, что обеспечивает бесшовную миграцию. Основные платформы и языки программирования для разработчиков, такие как C++, .NET, Java, Python и Rust, уже предлагают версии, специально оптимизированные для Arm.
Среди сервисов Microsoft, задействующих виртуальные машины Cobalt 200, числятся Dataverse и базы данных Azure. Ранее Google заявила, что перенесла около 30 тысяч своих внутренних задач на архитектуру Arm с помощью фирменных чипов Axion и намерена переместить ещё примерно 70 тысяч. В свою очередь, Oracle несколько лет назад закончила перевод всех облачных сервисов на Arm, аналогично поступила и AWS, которая также получила заказы на поставку процессоров Graviton от Snowflake, Anthropic и Meta✴.
Среди сервисов Microsoft, использующих ВМ Cobalt 200 — Dataverse и базы данных Azure. Напомним, что ранее Google объявила, что портировала около 30 тыс. внутренних нагрузок на Arm-архитектуру с использованием собственных Arm-чипов Axion и планирует перенести ещё порядка 70 тыс. В свою очередь, Oracle ещё несколько лет назад завершила миграцию всех своих облачных сервисов на Arm, как и AWS, также получившая заказы на поставку Graviton от Snowflake, Anthropic и Meta✴.
Microsoft подчеркнула, что запуск ВМ Cobalt 200 позволил расширить ассортимент виртуальных Arm-машин для обслуживания более широкого круга рабочих задач. Если на основе Cobalt 100 предлагаются семейства ВМ общего назначения (Dp, Dpl) и оптимизированные для памяти (Ep), то Cobalt 200 дал возможность добавить ещё две категории ВМ: Mpsv4 с увеличенным объёмом памяти и Lpsv5 с плотным локальным хранилищем, обеспечивая больший выбор в плане вычислительных мощностей, памяти и хранилища.
ВМ на базе Arm-процессоров Cobalt 200 уже доступны в формате предварительных версий. Новые ВМ будут доступны в следующих регионах: West US3, East US2, Central US, Sweden Central, East US, West US2, Spain Central и Indonesia Central. Об их доступности в других регионах будет объявлено позже.
Источник:
- Microsoft Azure: Cloud Computing Platform & Services