Компании OpenAI и Broadcom анонсировали специализированный чип Jalapeño, созданный в плотной кооперации «в соответствии с представлениями OpenAI о будущем инференса больших языковых моделей». По результатам начальных испытаний, ускоритель первого поколения демонстрирует заметно более высокую производительность на ватт по сравнению с существующими решениями.
Как заявляет OpenAI, Jalapeño был спроектирован с чистого листа для работы с нынешними и перспективными LLM. Благодаря применению ИИ-моделей OpenAI на всех этапах — от начального проектирования до запуска в производство — на создание чипа ушло всего девять месяцев. В OpenAI подчеркнули, что разработка Jalapeño велась, «исходя из стратегии развития моделей, ядер, инфраструктуры обслуживания и потребностей продукта, совместно с партнёрами Broadcom и Celestica». Ускоритель задуман не как изолированное устройство, а как элемент масштабируемого программно-аппаратного комплекса.
Инженерные образцы Jalapeño уже функционируют в лабораторных условиях, решая задачи машинного обучения на целевых частотах и уровнях энергопотребления, включая работу с GPT‑5.3‑Codex‑Spark. Компания пообещала опубликовать детальный технический отчёт о характеристиках ускорителя в ближайшие месяцы. Как передаёт Bloomberg, со слов генерального директора Broadcom Хока Тана (Hock Tan), на текущий момент ускоритель позволяет сократить затраты примерно на 50 % по сравнению с типовыми ИИ-ускорителями.
Источник изображения: OpenAI
Отмечается, что архитектура чипа минимизирует перемещение данных и обеспечивает сбалансированность вычислительных мощностей, сетевых ресурсов и памяти, что позволяет добиться фактической загрузки, гораздо более близкой к теоретическому пику производительности. Внедрение аппаратных и сетевых решений Broadcom, в том числе Tomahawk, способствует выходу платформы на уровень крупномасштабного промышленного производства.
OpenAI заявила, что нацелена на создание полной экосистемы продукта. Компания не ограничивается разработкой передовых моделей и приложений на их базе. Она также занимается проектированием инфраструктуры, лежащей в основе: архитектуры чипов, ядер, систем памяти, сетей, управления, инструментов развёртывания и пользовательского интерфейса. Такой подход позволяет оптимизировать каждый уровень стека для достижения ключевой цели компании — сделать свои модели более быстрыми, надёжными и доступными для пользователей.
С целью снижения затрат на ИИ-инфраструктуру Amazon (Trainium), Google (TPU), Meta✴ (MTIA) и Microsoft (Maia) также разрабатывают собственные специализированные ИИ-ускорители.
Источник: