Компании d-Matrix и Gimlet Labs объявили о стратегическом альянсе, направленном на увеличение скорости и снижение энергопотребления при выполнении выводов ИИ для агентных задач в реальном времени.
В рамках сотрудничества Gimlet внедрит ускорители Corsair от d-Matrix в свою облачную платформу Gimlet Cloud, дополнив ими стандартные графические процессоры. В создаваемой гибридной системе GPU возьмут на себя наиболее требовательные к вычислительной мощности этапы инференса, а Corsair будут специализироваться на операциях, критичных к скорости доступа к памяти и минимальным задержкам. По заявлениям партнёров, такое комбинированное решение способно обеспечить до десятикратного превосходства по показателям задержки и пропускной способности на ватт в сравнении с системами, использующими исключительно GPU. Как отмечается в пресс-релизе, эта технология «прекрасно адаптирована для рабочих процессов, чувствительных к времени отклика, в том числе для спекулятивного декодирования — метода, широко применяемого в масштабных развёртываниях искусственного интеллекта для минимизации задержек».
Источник изображения: d-Matrix
Corsair выполнены в формате стандартных PCIe-карт с воздушным охлаждением, что даёт возможность их быстрого развёртывания в дата-центрах внутри существующих серверных стоек с GPU, без необходимости в специализированных корпусах или уникальных системах жидкостного охлаждения. Сетевые адаптеры d-Matrix Jetstream обеспечивают обмен данными между Corsair и GPU по обычному Ethernet, что упрощает интеграцию в масштабах всей инфраструктуры и способствует более рациональному использованию ресурсов.
Заин Асгар (Zain Asgar), соучредитель и генеральный директор Gimlet Labs, отметил, что «аппаратная платформа d-Matrix представляет собой оптимальное решение для тех фаз инференса, где графические процессоры расходуют энергию неэффективно». «Применяя Corsair для таких задач, как спекулятивное декодирование, мы можем предложить нашим клиентам существенно возросшую производительность без увеличения занимаемого пространства», — пояснил он.
Программная платформа Gimlet осуществляет интеллектуальное распределение и сопоставление рабочих нагрузок агентов между разнородными ускорителями от различных вендоров, поколений и архитектур, запуская каждый этап вычислений на наиболее подходящем для него оборудовании. Дата-центры Gimlet объединяют различные типы аппаратных решений, связывая их высокоскоростными соединениями для обслуживания передовых исследовательских лабораторий и других компаний, занятых в сфере разработки ИИ.
Эксперт Мэтт Кимбалл (Matt Kimball) из Moor Insights & Strategy в беседе с изданием Data Center Knowledge подчеркнул, что главный фактор успеха — это комбинация специального «железа» и грамотного программного управления. «Платформа d-Matrix создавалась с акцентом на эффективность выполнения моделей, а не на масштабирование их обучения, что отвечает запросам рынка в условиях перехода ИИ-приложений в промышленную эксплуатацию, — пояснил Кимбалл. — Однако аппаратной части мало — такие решения, как Gimlet, призваны облегчить внедрение и бесшовно встроиться в текущие процессы. Именно это формирует преимущество данного подхода».
Специалист также отметил, что основная польза технологии кроется в уровне абстракции, который предлагает Gimlet, давая возможность исполнять задачи на разнородных процессорах без необходимости изменять код. «ИИ-нагрузки становятся всё более разнотипными, однако бо́льшая часть инфраструктуры до сих пор заточена под один конкретный вид ускорителей», — добавил он. По его мнению, если Gimlet позволит разработчикам легко разворачивать решения на различных чипах, это приведёт к реальному росту общей производительности. «По-настоящему удачные платформы — те, которые программисты используют, не думая об особенностях «железа»», — резюмировал Кимбалл.
Партнёры намерены предложить свой совместный продукт избранным заказчикам через сервис Gimlet Cloud во второй части 2026 года.
Data Center Knowledge обратил внимание, что это отражает общую тенденцию в сфере ИИ-инфраструктуры: гибридные системы, скорее всего, станут стандартом на следующем витке внедрения искусственного интеллекта, а их результативность будет определяться как качеством программной координации, так и мощностью аппаратных компонентов.
Источник:
- datacenterknowledge.com