Компания Meta✴ была вынуждена увеличить срок службы некоторых своих серверов общего назначения с шести до семи лет из-за нехватки DRAM. Как сообщает The Wall Street Journal со ссылкой на внутренние документы техногиганта, компания не предвидела столь серьёзного дефицита поставок комплектующих, вызванного прежде всего нехваткой оперативной памяти и жёстких дисков. Ожидается, что эта нехватка сохранится как минимум до 2027 года.
Каждый год компания вкладывает колоссальные средства в инфраструктуру дата-центров, являясь одним из крупнейших в мире покупателей серверного оборудования. Однако даже повышение капитальных затрат до $125–$145 млрд в текущем году не позволяет обновлять серверы с прежней скоростью. Внутреннее моделирование Meta✴ показало, что продление срока эксплуатации серверов приведёт к увеличению ожидаемой годовой интенсивности отказов (AFR) с 4,8 % до 7,4 % в год. Такой уровень риска сочли допустимым, хотя продлевать срок службы оборудования до восьми лет не стали.
95 % мирового производства DRAM сосредоточено в руках Samsung Electronics, SK hynix и Micron Technology. В последние полтора года эти компании делают акцент на наращивании выпуска HBM для ускорителей искусственного интеллекта, поскольку такая память приносит значительно большую маржу, чем обычная серверная DRAM. По оценкам IDC, речь уже может идти не о временном, «циклическом» дефиците, а о стратегическом перераспределении производственных мощностей. Согласно прогнозам, к 2026 году на HBM будет приходиться около 25 % всех выпускаемых пластин DRAM, а спрос на неё растёт примерно на 70 % ежегодно.
Источник изображений: Meta✴
В итоге цены на DDR5 и прочие модули памяти значительно подскочили. Однако и с остальными комплектующими ситуация не лучше. Компания Western Digital уже реализовала даже ещё не выпущенные жёсткие диски, у Seagate дела также идут весьма успешно (с точки зрения самой фирмы), а сроки поставок отдельных моделей серверных процессоров увеличились до полугода. Таким образом, один из крупнейших мировых закупщиков серверного оборудования, в отличие от многих аналитиков, не рассчитывает на снижение стоимости памяти и других компонентов к концу 2026 года, а вместо этого предпочитает продлевать срок службы уже установленной техники.
Для менее крупных заказчиков это может стать сигналом о нарастающих сложностях с приобретением компонентов в ближайшем будущем. Если гиперскейлер не надеется получить достаточный объём памяти по разумной цене, то остальные могут столкнуться с ещё более длительными сроками поставок, частичным выполнением заказов и существенным ростом цен. Вполне возможно, что увеличение срока эксплуатации оборудования — оптимальный вариант не только для Meta✴, что, помимо прочего, приведёт к переносу капитальных затрат и замедлению внедрения более энергоэффективных и производительных платформ.
Более того, дефициту HDD и SSD уделяется гораздо меньше внимания, чем нехватке DRAM, что, судя по всему, является ошибкой при планировании закупок. Массовые закупки жёстких дисков и рост цен на NAND оставляют всё меньше возможностей для манёвра при создании инфраструктуры хранения данных. По оценкам специалистов, новые производственные линии для модулей памяти заработают ещё не скоро, и дефицит может постепенно уменьшиться в 2027–2028 годах, когда начнут приносить результаты инвестиции, сделанные в 2024–2025 годах.
В качестве временного решения возможно повышение эффективности использования существующего оборудования с помощью программных средств. Например, NVIDIA представила новое ПО для мониторинга и продления срока службы ИИ-ускорителей в дата-центрах. С другой стороны, индустрия уже не впервые прибегает к увеличению срока эксплуатации оборудования. Так поступали Microsoft, Google, CloudFlare, Scaleway и другие.
Источники: