В условиях прекращения поставок в Россию графических ускорителей NVIDIA, блокировки загрузки драйверов и отсутствия технической поддержки, Институт искусственного интеллекта МФТИ осуществил анализ рынка доступных аналогов, в том числе продуктов китайских компаний Moore Threads и MetaX. Целью было определить, способны ли эти решения поддерживать полный цикл разработки и эксплуатации современных моделей искусственного интеллекта.
В рамках работы были изучены архитектурные особенности оборудования, драйверное обеспечение, совместимость с популярными фреймворками, а также проведены стресс-тесты при выполнении задач с большими языковыми моделями (LLM), компьютерным зрением и распределёнными вычислениями. Эксперты оценивали скорость и воспроизводимость результатов, стабильность работы под высокой нагрузкой и поведение моделей на разных платформах.
По итогам исследования было установлено, что ускорители Moore Threads s4000 и MetaX C500 пригодны для широкого круга задач. Они демонстрируют стабильную работу с распространёнными LLM, корректную поддержку современных фреймворков, предсказуемую производительность и надёжность при длительной эксплуатации. В некоторых типах вычислений эти решения показали результаты, сопоставимые или даже превосходящие NVIDIA A100.
Отдельное внимание уделялось интеграции альтернативных ускорителей в вычислительные узлы и кластеры. Как сообщили в МФТИ, разработанный программный стек позволяет эффективно распределять ресурсы, объединять мощности для работы с крупными моделями и создавать кластерные конфигурации. Институт планирует продолжить тестирование новых поколений оборудования, расширить список поддерживаемых моделей и подготовить отраслевые рекомендации для построения независимой ИИ-инфраструктуры.
Источник изображения: Walter Frehner / Unsplash
На основе полученных результатов в МФТИ был организован Центр компетенций по решениям, независимым от NVIDIA. Он аккумулирует лучшие инженерные практики, методики тестирования, оптимизированные конфигурации и опыт взаимодействия с вендорами. Центр будет помогать компаниям в подборе оборудования, проведении нагрузочного тестирования под конкретные задачи, настройке вычислительных цепочек, а также может оказывать сопровождение платформ в процессе их эксплуатации.
Оригинальная публикация: