Согласно информации из различных отраслевых источников, OpenAI выражает неудовлетворённость некоторыми чипами для искусственного интеллекта от NVIDIA и уже более года изучает возможные замены. Это может создать напряжённость в отношениях между ключевыми участниками рынка на фоне стремительного роста индустрии ИИ, пишет Reuters. Сдвиг в стратегии OpenAI связан с растущим вниманием к задачам инференса. NVIDIA традиционно лидирует в сегменте ускорителей для обучения нейросетей, однако сейчас инференс превратился в самостоятельный и высококонкурентный рынок.
Действия OpenAI бросают вызов монополии NVIDIA в сфере ИИ и создают препятствия для сделки стоимостью около $100 млрд, в рамках которой производитель чипов должен был получить долю в ИИ-стартапе в обмен на приоритетный доступ к самым современным ускорителям. Изначально планировалось завершить сделку за несколько недель, однако переговоры затянулись на месяцы. Параллельно OpenAI подписала соглашения с AMD и Cerebras (компанией, которую в прошлом даже рассматривали для приобретения) о поставках «альтернативных» чипов, а также совместно с Broadcom ведёт разработку собственного ИИ-ускорителя. Amazon и Google также выразили готовность предоставить OpenAI свои процессоры. Корректировка планов OpenAI повлияла на её потребности в вычислительных ресурсах и замедлила диалог с NVIDIA.
Источник изображения: Robin Jonathan Deutsch / Unsplash
В прошлую субботу CEO NVIDIA Дженсен Хуанг (Jensen Huang) опроверг слухи о разногласиях с OpenAI, назвав их «вздором». Он подчеркнул, что клиенты по-прежнему выбирают решения NVIDIA для инференса, поскольку компания предлагает оптимальное сочетание производительности и совокупной стоимости владения, особенно в крупных масштабах. Со своей стороны, представитель OpenAI заявил, что компания продолжает полагаться на NVIDIA для поставок основной массы чипов, предназначенных для инференса, отмечая, что именно их продукты обеспечивают максимальную производительность на каждый потраченный доллар. Генеральный директор OpenAI Сэм Альтман (Sam Altman) добавил, что NVIDIA создаёт «лучшие в мире чипы» и выразил надежду, что OpenAI останется её «крупнейшим» клиентом на долгие годы вперёд.
По информации Reuters, ссылающейся на семь информированных лиц, OpenAI не вполне довольна скоростью вывода, которую обеспечивают чипы NVIDIA. Особенно это касается узких областей, таких как генерация программного кода искусственным интеллектом или его взаимодействие с другим софтом. Как отметил один из собеседников, для компании становится необходимым новое аппаратное решение, которое в перспективе должно будет покрывать около 10% вычислительных потребностей для задач инференса.
Источник изображения: OpenAI
OpenAI изучала возможности сотрудничества с ИИ-стартапами, такими как Cerebras и Groq, для получения доступа к более быстрым чипам вывода, однако NVIDIA фактически поглотила Groq за 20 миллиардов долларов, что положило конец переговорам. Хотя формально речь идёт о неэксклюзивном лицензировании технологий Groq, что теоретически оставляет доступ для сторонних фирм, на практике почти все ключевые разработчики перешли в NVIDIA, а оставшаяся небольшая группа занимается поддержкой существующих облачных контрактов с клиентами.
Чипы NVIDIA отлично справляются с обработкой огромных массивов данных при обучении масштабных ИИ-моделей, подобных тем, что лежат в основе ChatGPT. Однако дальнейшее развитие требует широкого применения уже обученных моделей для последующего вывода и рассуждений. Сообщается, что с 2025 года OpenAI ищет альтернативы ускорителям NVIDIA, уделяя особое внимание компаниям, которые создают чипы с большим объёмом встроенной SRAM-памяти. Решение Maia 200 от Microsoft, судя по всему, не вполне соответствует её запросам.
Источник изображения: Hermann Wittekopf - kmkb / Unsplash
Вывод результатов обученной моделью предъявляет более высокие требования к памяти, в отличие от этапа обучения, тогда как вычислительная нагрузка, напротив, снижается. В результате зачастую больше времени тратится на доступ к данным, чем на сами вычисления. NVIDIA и AMD используют внешнюю память, что замедляет процессы, например, при общении с чат-ботами. В OpenAI столкнулись с проблемами при использовании системы Codex, которую компания активно продвигает для автоматического написания кода. Специалисты полагают, что некоторые недостатки системы связаны именно с аппаратной платформой NVIDIA.
Другие игроки рынка, конкурирующие с OpenAI, выбирают иные аппаратные решения. Компания Anthropic широко применяет чипы AWS Trainium и Google TPU, в то время как Google уже давно эксплуатирует собственные тензорные процессоры (TPU), которые теперь предлагает и сторонним заказчикам. Эти процессоры оптимизированы, в частности, для задач вывода моделей и по ряду параметров превосходят в производительности универсальные графические ускорители от AMD и NVIDIA.
После того как OpenAI чётко обозначила свою позицию относительно технологий NVIDIA, последняя предложила выкупить бизнес у разработчиков ускорителей, делающих ставку на SRAM-память, включая Cerebras и Groq. Cerebras отклонила это предложение и напрямую договорилась с OpenAI. Groq же вела переговоры о предоставлении своих вычислительных ресурсов OpenAI, что привлекло внимание инвесторов, оценивших компанию в $14 миллиардов.
Источник информации:
- Reuters