AWS представила один из самых масштабных в мире кластеров искусственного интеллекта — Project Rainier. Этот амбициозный проект фактически является распределённым между несколькими дата-центрами суперкомпьютером для ИИ, что знаменует важный этап в развитии ИИ-инфраструктуры AWS, сообщила пресс-служба Amazon. Платформа разрабатывалась специально для нужд компании Anthropic, которая недавно заключила многомиллиардное соглашение о применении Google TPU.
В реализации Project Rainier AWS тесно взаимодействовала со стартапом Anthropic. В рамках проекта задействовано приблизительно 500 тысяч процессоров Trainium2, а производительность вычислений в пять раз превышает показатели, которые Anthropic использовала для обучения предыдущих поколений ИИ-моделей. Project Rainier применяется Anthropic для разработки и развёртывания моделей линейки Claude. К 2025 году планируется использование свыше миллиона чипов Trainium2 для процессов обучения и логического вывода.
В рамках Project Rainier AWS уже построила инфраструктуру на базе Tranium2, которая на 70 % превосходит любую предыдущую вычислительную платформу ИИ в истории компании. Проект охватывает несколько американских дата-центров и не имеет аналогов среди других инициатив AWS. Он реализован как масштабный кластер EC2 UltraCluster, состоящий из серверов Trainium2 UltraServer. Каждый UltraServer объединяет четыре физических сервера, оснащённых 16 чипами Trainium2. Они взаимодействуют через фирменную систему соединений NeuronLink, обеспечивающую высокоскоростную коммуникацию внутри системы, что существенно ускоряет вычисления на всех 64 чипах. Тысячи UltraServer объединяются в UltraCluster с помощью коммуникационной фабрики EFA.
Источник изображения: AWS
Эксплуатация подобного дата-центра требует повышенной надёжности. В отличие от большинства облачных провайдеров, AWS самостоятельно разрабатывает оборудование и контролирует все компоненты — от микросхем до систем охлаждения и общей архитектуры дата-центров. Команды, управляющие ЦОД, уделяют особое внимание энергоэффективности, начиная от размещения стоек и заканчивая распределением электроэнергии и выбором способов охлаждения. Кроме того, в 2023 году всё энергопотребление Amazon полностью компенсировалось за счёт электроэнергии из возобновляемых источников. В Amazon заявляют, что на протяжении последних пяти лет компания остаётся крупнейшим покупателем возобновляемой энергии и намерена достичь нулевого уровня выбросов к 2040 году.
Источник изображения: AWS
Масштабные финансовые вливания направляются в атомную энергетику и аккумуляторные системы хранения энергии, параллельно реализуются значительные инициативы в сфере возобновляемых источников энергии для центров обработки данных. В 2024 году корпорация представила инновационные модули для ЦОД, интегрирующие решения в области энергоснабжения, температурного контроля и аппаратных компонентов — эти разработки предназначены как для новых строящихся площадок, так и для модернизации существующих. Ожидается, что нововведения смогут сократить энергопотребление отдельных элементов до 46% и уменьшить углеродный след производимого бетона на 35%.
Источник изображения: AWS
Для новых площадок, создаваемых в рамках проекта Rainier и других инициатив, планируется внедрение комплекса передовых технологий, направленных на оптимизацию энергозатрат и экологической ответственности. Часть решений касается рационального водопользования. AWS проектирует объекты с минимальным водопотреблением или полным отказом от него. Ключевой подход — исключение воды из систем охлаждения на большинстве площадок в течение большей части года с переходом на свободное воздушное охлаждение.
Например, одна из площадок проекта Rainier в штате Индиана будет преимущественно использовать атмосферный воздух, а в период с октября по март дата-центры полностью откажутся от водяного охлаждения, тогда как с апреля по сентябрь вода будет задействована в среднем лишь на несколько часов в сутки. Согласно исследованию Национальной лаборатории Лоуренса в Беркли (LBNL), типичный показатель водопотребления (WUE) для ЦОД составляет 0,375 л/кВт·ч. У AWS этот параметр достигает 0,15 л/кВт·ч, что на 40% эффективнее результатов 2021 года.
Источник:
- About Amazon