Intel, SambaNova и Foxconn создадут эталонную стойку для ИИ на Xeon: готовый референс для производителей серверов

Intel, совместно с SambaNova и Foxconn, анонсировала планы по разработке эталонного проекта стоечной ИИ-инфраструктуры на процессорах Intel Xeon, предназначенного для ЦОД, гиперскейлеров и центров интеллектуального управления.

По информации The Register, данная методика базируется на концепции дезагрегированного ИИ, ранее созданной Intel совместно с SambaNova. Архитектура распределяет ресурсоёмкие этапы предварительной обработки между GPU от NVIDIA, задействуя ИИ-ускорители SambaNova для интенсивных операций декодирования, что повышает выход токенов на каждого пользователя в 2–3 раза.

Глава Intel Лип-Бу Тан (Lip-Bu Tan) продемонстрировал два примера таких проектов. Первый ориентирован на агентные задачи, критичные к задержкам, второй — на достижение максимальной вычислительной плотности.

Источник изображения: Intel

Обе конфигурации поддерживают до 128 процессоров Intel: либо 128-ядерные Intel Granite Rapids Xeon 6, либо 288-ядерные Intel Clearwater Forest Xeon 6+, что в сумме даёт от 16 384 P-ядер до 36 864 E-ядер, а также до 384 Тбайт оперативной памяти DDR5 при энергопотреблении 100 кВт. Тан отметил, что системы на базе этого эталонного проекта станут широко доступны у ODM- и OEM-партнёров компании.

В рамках сотрудничества Foxconn возьмёт на себя задачи системной интеграции для новой стоечной ИИ-инфраструктуры. Компания также намерена выпускать вариант стоечной инфраструктуры с высокой плотностью процессоров для рабочих нагрузок, не требующих дополнительного ускорения, включая оптимизированные по стоимости задачи инференса, обработку данных и гибридный ИИ.

Intel сообщила, что облачный провайдер Vector Core Compute, созданный Vista Equity Partners и Cambium Capital, станет одним из первых, кто внедрит эту платформу, а Together.AI — её первым коммерческим клиентом.

В рамках выставки Computex 2026 компании Intel, SambaNova, Vista Equity Partners и Cambium Capital продемонстрировали первую реальную работу дезагрегированной системы инференса. Она использует процессоры Intel Xeon 6 для оркестрации и выполнения задач, блоки RDU SambaNova SN40 для декодирования, а также GPU NVIDIA Blackwell для предварительного заполнения. Система функционирует из ЦОД Vector Core Compute в Лос-Анджелесе (штат Калифорния, США).

Ранее NVIDIA анонсировала запуск похожей стоечной платформы, которая включает 256 88-ядерных процессоров Vera, ускорители Rubin и LPU Groq 3.

Arm также разрабатывает два референс-дизайна стоечных систем для агентных рабочих нагрузок на базе новых процессоров Arm AGI: одна система — с воздушным охлаждением на 36 киловатт и 8160 ядрами, другая — с жидкостным охлаждением на 200 киловатт и 45 696 ядрами.

Источник:

Понравилась статья?