Компания Positron AI объявила о закрытии раунда финансирования серии B на сумму 230 миллионов долларов, что привело к оценке бизнеса свыше одного миллиарда. Финансирование возглавили ARENA Private Wealth, Jump Trading и Unless, к ним присоединились новые вкладчики Qatar Investment Authority (QIA), Arm и Helena, а также действующие инвесторы Valor Equity Partners, Atreides Management, DFJ Growth, Resilience Reserve, Flume Ventures и 1517.
Как отмечает издание eWeek, о событии было заявлено на форуме Web Summit Qatar, что демонстрирует укрепление глобальных позиций фирмы. Статус единорога был достигнут Positron AI за 34 месяца.
В Positron AI подчеркнули, что Jump Trading выступила одним из лидеров раунда, уже будучи клиентом компании. «В задачах, которые для нас критичны, ограничения всё чаще связаны с памятью и энергоэффективностью, а не с вычислительной мощностью», — пояснил технический директор Jump Trading. — «В ходе испытаний система Positron Atlas продемонстрировала примерно втрое меньшую полную задержку по сравнению с аналогичной платформой на NVIDIA H100 при оценке нагрузок инференса, в готовом к развёртыванию корпусе с воздушным охлаждением и с доступной для планирования цепочкой поставок».
Источник изображения: Positron AI
Привлечённые средства будут направлены на ускорение вывода новой платформы Asimov, созданной по индивидуальному проекту. Тестирование Asimov планируется завершить к концу третьего квартала, а пилотные поставки начнутся в конце первого квартала 2027 года. Как сообщил технический директор Positron изданию EE Times, в Asimov применяется память LPDDR (без использования HBM), однако возможность приближения к теоретическому пику пропускной способности памяти позволяет компании обходиться без HBM для высокоскоростной генерации токенов.
Вычислительные модули Asimov представляют собой усовершенствованную версию блоков Atlas, дополненных ядрами Arm и усовершенствованной системой межсоединений. Объём встроенной памяти LPDDR5x в Asimov может быть увеличен с помощью технологии CXL — с 864 ГБ до 2,3 ТБ на одном кристалле. Чип также обеспечивает создание двух независимых доменов памяти для более эффективного её использования. В качестве интерфейса для подключения к хосту используется PCI 6.0 x32.
Несмотря на то, что память LPDDR5x дешевле и обладает большей ёмкостью по сравнению с HBM, её пропускная способность существенно ниже. Например, ускорители Rubin от NVIDIA оснащены 288 ГБ памяти HBM4 с пиковой пропускной способностью 22 ТБ/с, тогда как для Asimov этот показатель, судя по всему, ограничен примерно 3 ТБ/с, сообщает The Register (в официальных спецификациях указано 2,76 ТБ/с). По заявлению Positron, ключевое отличие заключается в том, что их чипы способны задействовать до 90% этой пропускной способности, в то время как GPU на базе HBM в реальных условиях редко используют более 30% от пикового значения. Тем не менее, даже с учётом этого, память Rubin остаётся примерно в 2,4 раза быстрее, чем у Asimov.
Источник изображения: Positron AI
Как сообщает компания, 400-ваттный чип содержит систолический массив размером 512×512, функционирующий на частоте 2 ГГц и поддерживающий форматы данных TF32, FP16/BF16, FP8, NVFP4 и INT4. Управление этим массивом осуществляется группой ядер Armv9, причём его конфигурация может быть изменена, например, на 128×512 (GEMV) или 512×128 (GEMM), в зависимости от того, какой вариант лучше подходит для конкретной вычислительной задачи.
Четыре чипа Asimov объединяются в 4U-платформу Titan с воздушным охлаждением, обеспечивая пропускную способность межчиповой связи на уровне 16 Тбит/с. Компания отмечает, что Asimov поддерживает до 2 ТБ памяти на один ускоритель, а система Titan — до 8 ТБ, что сопоставимо с общей пропускной способностью памяти ускорителя NVIDIA Rubin. При масштабировании до уровня стойки это позволяет достичь объёма памяти свыше 100 ТБ. До 4096 систем Titan (что эквивалентно 16384 ускорителям) могут быть объединены в единый масштабируемый домен с более чем 32 ПБ памяти. Это реализуется за счёт прямого межчипового соединения, а не с помощью коммутируемых масштабируемых сетей, как в стоечных архитектурах NVIDIA или AMD.
Positron акцентирует внимание на том, что её архитектура, сфокусированная на эффективной работе с памятью, открывает возможности для высокопроизводительного вывода (инференса), включая работу с большими языковыми моделями с длинным контекстом, агентными рабочими процессами, а также моделями нового поколения для обработки медиа и видео.
Оригинальная публикация:
- The Register