На форуме Finopolis Георгий Гайков из MWS AI заявил, что модели Google, такие как Gemini 2.5 Pro, опередили ChatGPT-5 в тестах на русском языке. Китайские Qwen-модели вошли в топ-10 благодаря своей открытости для дообучения.
Модели искусственного интеллекта, разработанные компанией Google, продемонстрировали высочайшие результаты в области работы с русским языком, опередив по этому показателю ChatGPT-5.
Об этом РИА Новости сообщил ведущий инженер-исследователь из MWS AI (входит в состав МТС Web Services) Георгий Гайков во время мероприятия Finopolis, посвященного инновациям в финансовых технологиях, проводимого Банком России. "MWS AI провела анализ мультимодальных моделей на русском языке, представляющих собой генеративный искусственный интеллект нового поколения, способный одновременно обрабатывать текст и изображения. ChatGPT-5 не попала в тройку лучших. Абсолютными лидерами с существенным отрывом стали две модели от Google: Gemini 2.5 Pro и Gemini 2.5 Flash", - заявил Гайков.Третье место, по его словам, досталось ChatGPT-4.1 mini. Четвертое и пятое места заняли разработанные американской компанией Anthropic Claude Sonnet 4.5 и ChatGPT-5.
Китайские модели, такие как Qwen2.5 VL и Qwen3-VL, вошли в десятку лидеров. По мнению эксперта, их ключевое преимущество заключается в открытости, что позволяет адаптировать их к русскому языку и разрабатывать собственные решения, сопоставимые по качеству с лучшими западными образцами, подчеркнул Гайков.
Для проведения тестирования был создан первый открытый бенчмарк MWS Vision Bench. В ходе экспериментов модели проверяли на:
эффективность в распознавании текста на изображениях, понимание структуры документов, нахождение необходимой информации, определение расположения элементов, способность отвечать на сложные вопросы по содержимому. "Сейчас активно появляются различные ИИ-модели, однако мало инструментов для оценки их пригодности для практических задач. Это усложняет сравнение результатов и выбор подходящих решений для бизнес-процессов. Без общепринятых стандартов сложно определить, какая модель лучше выполнит анализ документов, извлечение данных или автоматизацию обслуживания клиентов", - добавил Гайков.
Свежие комментарии