Qualcomm бросает вызов HBM: новая память HBC на базе LPDDR обещает прорыв в производительности ИИ

Компания Qualcomm представила High Bandwidth Compute (HBC) — гибридное вычислительно-памятное решение, которое позиционируется как альтернатива памяти HBM и призвано обеспечить более высокую производительность, эффективность и пропускную способность. В основе разработки лежит трёхмерная архитектура Near-Memory Computing (NMC), позволяющая разместить быструю память максимально близко к вычислительным ядрам.

В конструкции HBC применяется память LPDDR, которая укладывается вертикально в несколько слоёв, соединённых сквозными кремниевыми контактами (TSV). Такой подход даёт более высокую энергоэффективность по сравнению с традиционной HBM, где в вертикальных слоях используется память DDR, поскольку чипы LPDDR потребляют меньше энергии, сохраняя при этом сопоставимые показатели пропускной способности и ёмкости.

В основании HBC находится вычислительный кристалл, который берёт на себя часть обработки данных основного процессора, тем самым снижая его нагрузку. Как отмечает ресурс Techpowerup, данная технология схожа с той, что применяется в памяти HBM4, где базовый кристалл выполняет роль логического для более эффективной интеграции вычислительных задач, таких как трассировка пакетов и подготовка данных для ввода и вывода из HBM.

Источник изображений: Qualcomm

Qualcomm сообщает, что HBC обеспечивает шестикратное увеличение пропускной способности на ватт по сравнению с HBM, исходя из опубликованных характеристик конкурирующих продуктов, нормализованных на уровне платы, а также 200-кратное увеличение ёмкости на ватт по сравнению с SRAM, согласно опубликованным данным конкурентов, нормализованным на уровне стойки.

Первое поколение HBC (HBC Gen 1) продемонстрировало пропускную способность в 133 Тбайт/с на ускорителе AI250, что в 18 раз превышает показатель AI200 на LPDDR5X. Коммерческие испытания HBC1 совместно с AI250 запланированы на середину 2027 года. Компания намерена представить решение HBC Gen 2 в 2028 году. Эта разработка будет сочетаться с ИИ-ускорителем Qualcomm Dragonfly AI300 и обеспечит 54-кратное повышение эффективной пропускной способности относительно AI200, а также семикратный прирост пропускной способности на ватт по сравнению с HBM.

Dragonfly AI300 включает HBC2, что позволяет добиться высокой пропускной способности и низкой задержки для инференса больших языковых и мультимодальных моделей (LLM, LMM), а также для агентного ИИ. По заявлению Qualcomm, ожидается, что производительность будет в 4–8 раз выше по сравнению с существующими GPU-архитектурами с точки зрения пропускной способности памяти на ватт на карту. Масштабирование решения будет реализовано через интерконнекты UALink и ESUN с применением медных и оптических кабелей. Коммерческое производство образцов Dragonfly AI300 стартует в 2028 году.

Источник:

Понравилась статья?