На информационном ресурсе применяются рекомендательные технологии (информационные технологии предоставления информации на основе сбора, систематизации и анализа сведений, относящихся к предпочтениям пользователей сети "Интернет", находящихся на территории Российской Федерации)

Царьград

7 196 подписчиков

Свежие комментарии

  • Виктор Галкин
    Где фото, где хоть что то есть??"Тревога, срочно"...
  • Eduard
    Да кому это вообще надо накручивать? Вообще не надо никаких конкурсов глупых проводить просто вводите и всё!ЦБ опозорился. Пр...
  • Eduard
    Дешевле россиянам пиво налить!Бункерный обман: ...

Google обошёл ChatGPT-5 в тестах по русскому языку, отметил Гайков

На форуме Finopolis Георгий Гайков из MWS AI заявил, что модели Google, такие как Gemini 2.5 Pro, опередили ChatGPT-5 в тестах на русском языке. Китайские Qwen-модели вошли в топ-10 благодаря своей открытости для дообучения.

Модели искусственного интеллекта, разработанные компанией Google, продемонстрировали высочайшие результаты в области работы с русским языком, опередив по этому показателю ChatGPT-5.

Об этом РИА Новости сообщил ведущий инженер-исследователь из MWS AI (входит в состав МТС Web Services) Георгий Гайков во время мероприятия Finopolis, посвященного инновациям в финансовых технологиях, проводимого Банком России.

"MWS AI провела анализ мультимодальных моделей на русском языке, представляющих собой генеративный искусственный интеллект нового поколения, способный одновременно обрабатывать текст и изображения. ChatGPT-5 не попала в тройку лучших. Абсолютными лидерами с существенным отрывом стали две модели от Google: Gemini 2.5 Pro и Gemini 2.5 Flash", - заявил Гайков.

Третье место, по его словам, досталось ChatGPT-4.1 mini. Четвертое и пятое места заняли разработанные американской компанией Anthropic Claude Sonnet 4.5 и ChatGPT-5.

Китайские модели, такие как Qwen2.5 VL и Qwen3-VL, вошли в десятку лидеров. По мнению эксперта, их ключевое преимущество заключается в открытости, что позволяет адаптировать их к русскому языку и разрабатывать собственные решения, сопоставимые по качеству с лучшими западными образцами, подчеркнул Гайков.

Для проведения тестирования был создан первый открытый бенчмарк MWS Vision Bench. В ходе экспериментов модели проверяли на:

эффективность в распознавании текста на изображениях, понимание структуры документов, нахождение необходимой информации, определение расположения элементов, способность отвечать на сложные вопросы по содержимому.
"Сейчас активно появляются различные ИИ-модели, однако мало инструментов для оценки их пригодности для практических задач. Это усложняет сравнение результатов и выбор подходящих решений для бизнес-процессов. Без общепринятых стандартов сложно определить, какая модель лучше выполнит анализ документов, извлечение данных или автоматизацию обслуживания клиентов", - добавил Гайков.

 

Ссылка на первоисточник
наверх