Компания Alibaba анонсировала серверный процессор XuanTie C950 с тактовой частотой 3,2 ГГц, построенный на открытой архитектуре RISC-V и произведённый по 5-нанометровой технологии, как сообщает издание SCMP. По заявлению разработчика, чип создан для эффективной работы с облачными сервисами и задачами искусственного интеллекта, способен справляться со сложными многошаговыми операциями, которые выполняют ИИ-агенты.
В Alibaba называют этот процессор «самым производительным в мире на архитектуре RISC-V». Мэн Цзяньи (Meng Jianyi), ведущий учёный исследовательского подразделения компании DAMO Academy, отметил, что быстродействие модели C950 более чем втрое превышает показатели предыдущего поколения C920. «Открытость архитектуры RISC-V даёт разработчикам свободу в адаптации наборов инструкций и ускорении специализированных ИИ-задач с минимальными или нулевыми лицензионными отчислениями. Это имеет ключевое значение для создания ИИ-агентов», — цитирует заявление компании Reuters.
Источник изображения: Alibaba
Специалисты DAMO Academy, отвечавшие за проектирование чипа, пояснили, что платформа XuanTie позволяет настраивать схемы логического вывода (инференса), помогая заказчикам оптимизировать чипы под свои требования. В компании также заявили, что в сравнении с рядом серийных решений их процессор демонстрирует свыше 30 % прироста производительности «благодаря гибкой адаптации под конкретные сценарии применения». Разработка C950 заняла два года, и это первый чип в семействе XuanTie, изначально спроектированный с расчётом на выполнение инференса больших языковых моделей (LLM) как основной нагрузки. Предыдущая серверная модель, C930, была представлена в феврале 2025 года, а её поставки начались месяц спустя. Её предшественник, C920, выпускается с 2024 года.
Процессор XuanTie C950 представляет собой 64-разрядное решение с 8-инструкционным декодером и 16-ступенчатым конвейером, оснащённое предсказателем ветвлений TAGE и программируемым механизмом предварительной выборки. Он соответствует стандарту RVA23 и включает дополнительные команды. Заявленная производительность в тесте SPECint2006 достигает 22 балла на гигагерц. Чип поддерживает 256-битные векторные регистры и форматы данных FP16/BF16/FP32/FP64/INT8/INT16/INT32/INT64. Типичный объём кэша инструкций — 64 КБ с опциональной проверкой чётности, кэш данных также составляет 64 КБ с возможностью применения ECC. Каждое ядро обладает собственным кэшем второго уровня объёмом обычно 1 МБ, где ECC также является опцией. Стандартный кластер включает восемь ядер. Для внутреннего взаимодействия используется шина CHI.E/CHI.F, для внешних подключений — интерфейсы AMBA ACE4.0/AXI4.0.
Источник изображения: Alibaba
Благодаря глубокой интеграции программных и аппаратных компонентов, C950 демонстрирует высокую эффективность в облачных средах, включая работу с MySQL, Redis, Nginx и OpenSSL, а также выполнение логического вывода для крупных языковых моделей, таких как Qwen и DeepSeek. Производительность дополнительно усиливается при использовании фирменных ИИ-ускорителей — Alibaba Vector Acceleration Engine и Matrix Acceleration Engine. Оба движка создавались в тесной связи с процессорными ядрами, что обеспечивает их органичную интеграцию.
Как заявляет разработчик, C950 стал первым процессором на архитектуре RISC-V с аппаратной поддержкой логического вывода для языковых моделей, содержащих миллиарды параметров. Специальные расширения набора команд и аппаратные модули оптимизированы для эффективного выполнения ключевых операций в моделях типа Qwen3 и DeepSeek V3, минимизируя дополнительные затраты. Данный процессор занимает ведущее положение в линейке чипов Alibaba.
Источники: