Первые процессоры Vera от NVIDIA, созданные компанией, были отправлены в Anthropic, OpenAI, Oracle Cloud Infrastructure (OCI) и SpaceX/xAI. Эти чипы спроектированы с учётом специфики «агентных» ИИ-систем и существенно отличаются от стандартных CPU.
Это первый кастомный процессор NVIDIA, целенаправленно созданный для агентных систем. Он управляет оркестрацией, вызовом инструментов, нагрузками RL, анализом данных, «песочницами» для агентов и другими задачами. Данный чип ориентирован на ИИ-лаборатории, облачных провайдеров и компании, активно работающие с агентными ИИ-системами. Модель оснащена 88 кастомными ядрами Olympus, а пропускная способность памяти достигает 1,2 Тбайт/с.
Генеральный директор NVIDIA Дженсен Хуанг (Jensen Huang) представляет Vera как новое многомиллиардное направление развития корпорации. По данным NVIDIA, агентный ИИ создаёт значительно более высокую нагрузку на вычислительную инфраструктуру — от компиляции и тестирования программного кода до анализа данных и поиска файлов. При этом ИИ-агенты не только задействуют ускорители, но и требуют оркестрации, управления агентными «песочницами» и прочего — это задачи для CPU. Поток параллельных задач перегружает обычные процессоры, не рассчитанные на такие объёмы, однако характеристики Vera позволяют повысить общую эффективность ИИ-фабрик.
Источник изображения: NVIDIA
OCI планирует развернуть сотни тысяч CPU Vera для поддержки нового поколения корпоративного ИИ. Этот облачный провайдер станет первым, кто внедрит Vera в таких масштабах. Для корпоративных заказчиков это означает создание агентной ИИ-инфраструктуры уровня, недоступного другим облачным провайдерам. Ранее сообщалось, что Oracle строит «вчерашние» ЦОД, не имея достаточных средств, и теперь компания, похоже, готова опровергнуть это утверждение.
Источник изображения: NVIDIA
Процессор выступает не только в роли самостоятельного CPU, но и служит основой для платформы Vera Rubin NVL72, где он через NVLink-C2C второго поколения соединяется с парой GPU Rubin. Следует отметить, что разработки в рамках Vera ведутся уже продолжительное время. К примеру, ещё в марте компания HPE представила узлы на базе NVIDIA Vera для платформы Cray Supercomputing GX5000.
Источник: