Национальный суперкомпьютерный центр Китая в Шэньчжэне (NSCCSZ) представил проект вычислительного комплекса LineShine (LingSheng), чья производительность после полного ввода в строй достигнет 2 экзафлопс. Уникальность данной системы заключается в том, что её архитектура предусматривает использование исключительно CPU-серверов — без каких-либо GPU-ускорителей.
Как сообщает портал HPC Wire, LineShine будет развёртываться поэтапно. Одна из секций нового суперкомпьютера будет оснащена серверами Huawei Kunpeng, насчитывающими десятки тысяч вычислительных ядер. Планируется задействовать 428 узлов хранения общей ёмкостью 650 Пбайт. Заявленная пропускная способность составляет 10 Тбайт/с.
Вторая секция LineShine включает 20480 вычислительных узлов, каждый из которых оборудован двумя процессорами LX2 на архитектуре Armv9. Конструкция чипов LX2 состоит из двух вычислительных кристаллов со 152 ядрами (всего 304 ядра) и восьми стеков памяти HBM (32 Гбайт, 4 Тбайт/с). Каждый кристалл использует 128 Гбайт внешней памяти DDR. Для обмена данными между блоками DDR и HBM применяется специальный механизм SDMA. Каждый кристалл разделён на четыре NUMA-домена (38 ядер и 4 Гбайт HBM).
Узлы объединены высокоскоростным интерконнектом LingQi, который обеспечивает пропускную способность до 1,6 Тбит/с на узел. Сообщается о поддержке режимов FP64/FP32/FP16/INT8. Заявленная производительность LX2 достигает 60,3 Тфлопс в операциях FP64 и 120,6 Тфлопс в операциях FP32. Таким образом, пиковая теоретическая производительность FP64 составляет 2,47 Эфлопс.
Источник изображения: South China Morning Post
Для сопоставления, самый производительный на данный момент суперкомпьютер в мире согласно рейтингу TOP500 — американский комплекс El Capitan — демонстрирует производительность 1,809 экзафлопса с пиковым показателем 2,821 экзафлопса, однако в его конструкции задействованы как центральные процессоры, так и ускорители (AMD Instinct MI300A). Следовательно, LineShine станет наиболее мощным HPC-комплексом, созданным исключительно на основе CPU. Ещё одной отличительной чертой машины является то, что в ней будут использоваться исключительно китайские компоненты, включая процессоры, накопители и сетевое оборудование. При этом официально КНР не участвует в TOP500 уже пять лет, а также в целом не стремится раскрывать информацию о своих самых мощных суперкомпьютерах.
Стоит отметить, что в Китае функционирует ещё один суперкомпьютер экзафлопсного класса — система China New-generation Intelligent Supercomputer (CNIS). Этот комплекс обладает гетерогенной конфигурацией, включающей 5632 вычислительных узла. Каждый из них оснащён двумя 64-битными серверными процессорами на базе CISC с 64 ядрами (2,4 ГГц) и восемью ускорителями GPGPU с архитектурой SIMT и 64 Гбайт HBM (1,8 Тбайт/с). Используется 8-канальная подсистема памяти DDR5-6400. Каждый GPGPU обеспечивает пиковую производительность 32,7 Тфлопс в режиме FP64, 65,5 Тфлопс при операциях FP32 и 470 Тфлопс в режиме FP16, что в совокупности даёт пиковую теоретическую производительность FP64 на уровне 1,47 экзафлопса.
Источник: