Как сообщает издание EETimes, южнокорейская компания HyperAccel намерена представить рынку специализированный процессор Bertha 500, созданный для задач вывода в системах искусственного интеллекта. Разработчик заявляет, что уникальная архитектура чипа позволяет ему обрабатывать в пять раз больше токенов в секунду, чем GPU-решения с аналогичными показателями TOPS.
Ключевой особенностью Bertha 500 является его экономичность. Для снижения затрат вместо дорогой памяти HBM здесь применяется LPDDR. Отказ от классической иерархии памяти позволяет задействовать до 90% пропускной способности LPDDR. Эффективность дополнительно повышена за счёт архитектурной оптимизации именно под инференс. Для сравнения, по данным HyperAccel, графические процессоры при выводе используют лишь около 45% пропускной способности памяти и 30% вычислительных мощностей. Таким образом, чип Bertha 500, слегка уступая в пиковой производительности, обеспечивает существенное сокращение стоимости решений.
Процессор Bertha 500 будет изготавливаться по 4-нанометровому технологическому процессу Samsung. Его структура включает 32 вычислительных ядра LPU (LLM Processing Unit), четыре ядра Arm Cortex-A53 и 256 МБ статической памяти SRAM. Подсистема памяти LPDDR5x использует восемь каналов с суммарной пропускной способностью до 560 ГБ/с. Заявленная производительность в операциях INT8 достигает 768 TOPS. Также поддерживаются иные 16-, 8- и 4-битные форматы, включая FP16. По утверждению HyperAccel, удельная пропускная способность Bertha 500 в расчёте на один доллар стоимости примерно в 20 раз выше, чем у NVIDIA H100, а энергоэффективность больше в пять раз. Типичное энергопотребление чипа составит около 250 Вт.
Источник изображения: EETimes
Программное обеспечение HyperAccel совместимо со всеми моделями из репозитория HuggingFace. Параллельно компания разрабатывает предметно-ориентированный язык Legato, который даст программистам низкоуровневый доступ к аппаратной платформе. Ожидается, что первые образцы Bertha 500 появятся к концу первого квартала 2026 года, а начало серийного выпуска запланировано на 2027 год.
Сообщается, что в сотрудничестве с LG стартап также создаёт облегчённую версию системы Bertha 500 для периферийных устройств — Bertha 100. Данная система-на-кристалле будет оснащена ядрами Arm Cortex-A55, отдельными компонентами от LG, а также поддержкой двухканальной памяти LPDDR5x. В числе потенциальных областей использования называются автопром, потребительская электроника и робототехника. Выпуск Bertha 100 планируется в форм-факторе модулей M.2: первые образцы появятся в четвёртом квартале этого года. Платформа, например, сможет выполнять преобразование текста в голос или распознавание речи.
Стартап HyperAccel был основан профессором Корейского института передовых технологий (KAIST) Джуёном Кимом совместно с группой его студентов в начале 2023 года. На данный момент компания привлекла 45 миллионов долларов инвестиций, а её рыночная капитализация оценивается в 200 миллионов долларов. Численность сотрудников составляет около 80 человек. Первым продуктом HyperAccel стал специализированный сервер Orion на базе ПЛИС, созданный для выполнения задач искусственного интеллекта.
Источник: