Корпорация Microsoft открыла в Атланте (штат Джорджия) второй центр обработки данных для искусственного интеллекта в рамках проекта Fairwater, объединив его с аналогичным объектом в Висконсине для формирования масштабного вычислительного кластера. Соединение между ЦОД обеспечивается через специализированную оптоволоконную сеть AI Wide Area Network (AI WAN), созданную специально для решения задач искусственного интеллекта. Точные параметры и производительность нового центра пока не разглашаются, однако серия этих дата-центров станет крупнейшим проектом Microsoft за всю её историю и, вероятно, одним из самых значительных в мире.
В дата-центре применяется замкнутая система жидкостного охлаждения, обслуживаемая одной из самых мощных чиллерных установок в мире. Каждая стойка поддерживает мощность около 140 кВт (1360 кВт на ряд). Объект оснащён сотнями тысяч современных ускорителей NVIDIA GB200/GB300 NVL72 для ИИ, связанных двухуровневой сетью 800GbE с коммутаторами на платформе SONiC. Атлантский ЦОД имеет двухэтажную конструкцию, что позволяет сократить дистанции между стойками по всем трём пространственным направлениям.
Источник изображения: Microsoft
Для сети AI WAN Microsoft совместно с OpenAI, NVIDIA и другими партнёрами разработала и внедрила протокол Multi-Path Reliable Connected (MRC), обеспечивающий оптимальное взаимодействие между распределёнными дата-центрами класса Fairwater при обучении гигантских моделей, которые невозможно разместить в пределах одного ЦОД. Суммарная протяжённость кабельных линий AI WAN превышает 193 тысячи километров.
Источник изображения: Microsoft
В компании Microsoft подчеркнули, что стабильная энергосистема Атланты позволила обойтись без строительства собственных электростанций, специализированных источников бесперебойного питания и дублирующих энерголиний, что ускорило ввод дата-центра в эксплуатацию и снизило операционные расходы. Как заявили в корпорации, им удалось обеспечить уровень доступности 99,99 % при затратах, характерных для 99,9 %.
Источник изображения: Microsoft
Также были созданы специальные программно-аппаратные механизмы регулирования энергопотребления, которые компенсируют пиковые нагрузки в сети, возникающие при работе систем искусственного интеллекта. Это достигается путём запуска фоновых процессов в периоды низкой активности, автоматического снижения мощности графических процессоров и применения локальных систем накопления энергии.
Источник изображения: Microsoft
Microsoft продолжает развёртывание новых объектов в рамках проекта Fairwater, планируя объединить их в единую инфраструктуру, где дата-центры станут элементами распределённого виртуального суперкомпьютера. Такой подход позволяет решать задачи, недостижимые для изолированных вычислительных комплексов. По мнению представителей компании, если классические дата-центры обслуживают множество приложений для разных пользователей, то «ИИ-суперфабрика» концентрируется на выполнении единой сложной задачи с использованием миллионов вычислительных ускорителей.
Капитальные инвестиции Microsoft в дата-центры и ускорители продолжают стремительно увеличиваться. При этом руководство компании признаёт, что «фактически никто не желает видеть дата-центр по соседству». Жители многих территорий выражают обеспокоенность потенциальным ростом тарифов на услуги ЖКХ, негативным влиянием на окружающую среду и другими факторами.
Источник: