Партнерство нацелено на создание аппаратно-программного решения, которое значительно повысит скорость и снизит энергопотребление при выполнении моделей искусственного интеллекта. Фокус сделан на...
Компания анонсировала специализированную платформу хранения контекста для инференса (ICMSP), предназначенную для решения проблемы масштабирования кэша ключей и значений (KV-cache) в больших языковых...