Крупнейшие технологические гиганты Китая, такие как Alibaba и ByteDance, обучают свои новейшие языковые модели в дата-центрах, расположенных в странах Юго-Восточной Азии. Эта практика обусловлена отсутствием доступа к современным ускорителям NVIDIA на территории КНР из-за американских экспортных барьеров, сообщает The Financial Times со ссылкой на осведомлённые источники.
Как отмечают эксперты, после апрельских ограничений администрации США на поставки специализированных чипов NVIDIA H20 для китайского рынка наблюдается стабильный рост объёмов обучения искусственного интеллекта за пределами страны. Представитель сингапурского оператора ЦОД прокомментировал эту ситуацию: «Создание передовых алгоритмов требует мощнейшего процессорного оборудования, и текущие операции полностью легальны». Сейчас в Сингапуре и Малайзии активно развивается инфраструктура центров обработки данных, чему дополнительно способствует китайский спрос. Многие из этих объектов укомплектованы высокоскоростными чипами NVIDIA.
По информации источников, применяется прозрачная операционная модель. Китайские корпорации арендуют мощности иностранных дата-центров, которые принадлежат и администрируются некитайскими юрлицами. Это соответствует американским экспортным нормам, поскольку «Правило распространения ИИ» — регуляторная мера против обхода ограничений, принятая при администрации Байдена, — было отменено Дональдом Трампом в мае. Китайские предприятия неоднократно фиксировались при использовании зарубежных мощностей как в текущем, так и в предыдущем году.
Источник изображения: Mark Daynes / Unsplash
Однако существуют и отдельные случаи. По информации инсайдеров, DeepSeek, к примеру, проводит обучение своих нейросетевых моделей непосредственно в Китае. Как отмечают осведомлённые лица, компании удалось сформировать резерв чипов NVIDIA до того, как американские экспортные ограничения вступили в силу. Кроме того, DeepSeek активно взаимодействует с отечественными производителями полупроводников, в том числе с отраслевым гигантом Huawei, с целью усовершенствования и создания нового поколения ускорителей для искусственного интеллекта. Со своей стороны, Huawei рассматривает сотрудничество с DeepSeek как стратегический шаг для укрепления позиций своей продукции на внутреннем рынке.
В течение последнего года ИИ-системы Qwen от Alibaba и Doubao от ByteDance заслужили международное признание в числе наиболее производительных больших языковых моделей. Модель Qwen также стала популярной среди зарубежных разработчиков благодаря своей открытой архитектуре. При этом многие китайские корпорации по-прежнему выбирают передовые ускорители NVIDIA для обучения моделей, однако для инференса — процесса, набирающего всё большее значение, — они всё активнее применяют локально производимые чипы.
Китайские технологические гиганты также размещают дата-центры в Юго-Восточной Азии для обслуживания иностранных заказчиков, поскольку такие компании, как Alibaba и ByteDance, наращивают присутствие на глобальном рынке облачных сервисов. Одновременно китайский бизнес расширяет использование ЦОД в других частях света, включая Ближний Восток. В то же время, как поясняют отраслевые эксперты, из-за действующих в КНР ограничений на трансграничную передачу персональных данных, адаптацию моделей под локальных пользователей необходимо осуществлять внутри страны.
Источник: