Группа "Т-Технологии" представила две большие языковые модели
МОСКВА, 11 декабря. /ТАСС/. Группа "Т-Технологии" представила две большие языковые модели: T-Pro на 32 млрд параметров и обновленной T-Lite на 7 млрд параметров. Теперь использовать LLM (большие языковые модели) сможет любая компания, а не только крупнейшие корпорации, которые инвестируют в создание моделей с нуля или платят высокие комиссии вендорам за использование закрытых моделей. Об этом сообщается в материалах группы.
"Индустриальные бенчмарки: MERA, ruMMLU, Ru Arena Hard, MT Bench и AlpacaEval показали, что T-Lite и T-Pro превосходят все российские и зарубежные модели по общему уровню знаний, умению вести диалог и выполнять практические задачи", - говорится в сообщении.
Модели входят в Gen-T - семейство собственных специализированных языковых моделей группы "Т-Технологии". Они предназначены для решения конкретных узкоспециализированных задач в отличие от универсальных решений, таких как ChatGPT. Открытый доступ предполагает полностью бесплатное использование моделей для решения внутренних бизнес-задач и создания новых продуктов на базе LLM. Например, с помощью LLM можно создавать умных чат-ботов в поддержке, которые более приближены к человеческому общению и отвечают не по скриптам, а в режиме живого диалога. Это позволит частично или полностью автоматизировать разбор клиентских обращений.
В группе отмечают, что модели T-Lite и T-Pro основаны на базе моделей семейства Qwen-2.5, но показывают более высокое качество на задачах русского языка, чем оригинальные модели. Среди закрытых моделей T-Pro занимает второе место по ряду бенчмарков, уступая лишь GPT-4o.
"Такой подход позволяет "Т-Технологиям" существенно сократить затраты на создание больших языковых моделей - на 80-90% по сравнению с компаниями, которые обучают их с нуля. При этом качество решений LLM-продуктов на русском языке превосходит решения, базирующиеся на открытых и проприетарных моделях от OpenAI, Google и Anthropic", - отмечается в материале.


