Бизнес-направление Yandex B2B Tech (структурное подразделение «Яндекса», консолидирующее технологические решения для корпоративного сегмента, в том числе сервисы Yandex Cloud и «Яндекс 360») анонсировала запуск нового поколения генеративных моделей Alice AI LLM для клиентов облачной инфраструктуры Yandex Cloud.
Alice AI LLM представляет собой ключевую разработку «Яндекса» в области искусственного интеллекта. Архитектура модели основана на принципе ансамбля экспертов (MoE) с применением обучения с подкреплением в реальном времени (Online RL). Нейросеть распознаёт порядка 20 языков (включая японский) и применяется для выполнения комплексных заданий: поиска в базах знаний с последующей генерацией ответов (RAG-методология), обработки документов, формирования аналитических отчётов, автоматического извлечения и систематизации данных в CRM-системах, а также для разработки интуитивных ИИ-помощников.
Источник изображения: пресс-служба «Яндекса» / company.yandex.ru
Доступ к Alice AI LLM организован через OpenAI-совместимые интерфейсы Completions API и Responses API, а также через специализированный текстовый API с поддержкой REST и gRPC. Модель интегрируется с распространёнными opensource-библиотеками LangChain, AutoGPT и LlamaIndex.
В Yandex B2B Tech отмечают, что эксплуатация Alice AI обходится дешевле открытых аналогов благодаря усовершенствованной токенизации русского текста. В Alice AI один токен охватывает около 4–5 кириллических символов, тогда как в опенсорсных решениях — лишь 2–3 символа. Это снижает итоговую стоимость использования технологии в 1,5–2 раза при идентичных тарифах. Дополнительным преимуществом является дифференцированная тарификация: токены входящих запросов оцениваются вчетверо дешевле исходящих ответов, что способствует экономному расходованию ресурсов.
Источник: