Виртуальные GPU против физических: FirstVDS запустил серверы на NVIDIA L40S и показал реальные бенчмарки
Хостинг-провайдер FirstVDS представил новые тарифные планы с виртуальными GPU (vGPU) на основе NVIDIA L40S. В ассортименте теперь два предложения: можно взять в аренду целую физическую видеокарту (доступно с ноября 2025 года) либо получить гарантированную часть виртуального графического ускорителя.
Кроме того, компания провела сравнительное тестирование обеих технологий и обнародовала полученные данные: скорость инференса больших языковых моделей, генерацию видеоконтента и объем используемой видеопамяти.
Пользователям доступны четыре тарифа vGPU — от 4 до 16 Гбайт видеопамяти. Технология vGPU позволяет разделить физическую видеокарту на несколько профилей с фиксированным объемом ресурсов. Серверы функционируют на базе виртуализации KVM с процессорами AMD EPYC. Цена начинается от 299 рублей в сутки.
Для сопоставления: тарифы с физическим GPU (Passthrough) обойдутся от 1150 руб./сутки. В этих планах предлагаются RTX 4090 и 5090, L4 и L40S — вся видеокарта полностью выделяется для одной виртуальной машины.
За последние полгода спрос на GPU-серверы значительно увеличился — главным образом из-за задач, связанных с LLM, созданием изображений и видео. Однако не каждому проекту требуется 100% мощность физической карты. Разработчики, Data Science-команды и небольшие студии часто ищут более доступный вариант с предсказуемой долей ресурсов. Именно эту потребность закрывает vGPU.
Никита Попов, директор по продукту FirstVDS: «В ноябре мы удовлетворили запрос на чистую производительность, запустив GPU Passthrough. Но рынку нужен не только верхний предел мощности, но и разумная юнит-экономика. vGPU как раз заполняет эту нишу — снижает порог входа до 300 руб. в сутки. Мы провели бенчмарки. Сравнивать виртуалку с выделенной картой напрямую бессмысленно — физика берет свое, чудес не бывает. Наша задача была иной: четко определить границы применимости. Продемонстрировать механику, при которой vGPU справляется с нагрузкой, и где проходит черта, за которой необходимо брать полноценное оборудование».
Что показало тестирование
Компания протестировала две конфигурации: GPU Passthrough (L40S, 48 Гбайт, 16 ядер CPU) и vGPU 16 Гбайт (8 ядер CPU). В сценариях использовались инференс LLM через llama.cpp (модели Qwen 2.5 и 3.6) и генерация видео через ComfyUI с шаблоном Wan2.2 TI2V 5B Hybrid.
Результаты в целом ожидаемы: физическая карта, как и предполагалось, превосходит виртуальные GPU по производительности. Однако были выявлены два важных нюанса.
В ходе тестирования моделей средней размерности (qwen2.5-14b в двух вариантах квантизации — q3_k_m и q4_0) на vGPU-16 и Passthrough выяснилось, что при полном размещении модели в видеопамяти скорость генерации токенов практически идентична. Различия проявляются только в гибридном режиме CPU+GPU (до 30–40 слоёв), где vGPU-16 ограничивает вдвое меньшим количеством ядер процессора.
Сопоставление скорости генерации токенов (qwen2.5-14b) при разном количестве слоёв, загруженных в GPU. Passthrough против vGPU 16 Гбайт
Что касается более объёмных моделей (Qwen3.6-35B), они не помещаются целиком в vGPU-16 из-за нехватки памяти и функционируют исключительно в смешанном режиме CPU+GPU, что приводит к снижению скорости.
Генерация видео (ComfyUI) на vGPU-16 также возможна, но с определёнными ограничениями: пришлось отключить ряд функций и добавить swap, иначе приложение аварийно завершалось. Время генерации на vGPU-16, как и ожидалось, превышает показатели Passthrough (для 5-секундного ролика — 293 секунды против 144).
Таким образом, несмотря на явное превосходство физической карты, виртуальный GPU способен справляться с некоторыми задачами — например, с инференсом средних языковых моделей при полной загрузке в видеопамять. Это делает vGPU разумным выбором, когда приоритетом является доступная цена. Для более ресурсоёмких сценариев (крупные модели, комфортная генерация видео без дополнительных настроек) производительности vGPU может оказаться недостаточно.
Полные результаты тестирования представлены в отдельной статье.
О компании
FirstVDS — российский провайдер виртуальных серверов. В ассортименте — готовые и настраиваемые конфигурации VPS/VDS: от высокопроизводительных CPU-серверов (линейка «CPU.Турбо 2.0» до 5,7 ГГц) до GPU-решений (Passthrough и vGPU). Также доступны S3-хранилище, домены, SSL и круглосуточная техподдержка. Дата-центры расположены в Москве, Нидерландах и Казахстане. Компания работает на рынке более 20 лет.
Откуда взято:
- FirstVDS