На информационном ресурсе применяются рекомендательные технологии (информационные технологии предоставления информации на основе сбора, систематизации и анализа сведений, относящихся к предпочтениям пользователей сети "Интернет", находящихся на территории Российской Федерации)

Царьград

7 215 подписчиков

Свежие комментарии

  • Ильдус Зубаиров
    Кстати, "Пластун-ТТМ" это простой багги. На Юге использовать ещё можно! Но Россия это Северная страна и эти транспарт...Центр анализа стр...
  • Teodor
    Интересное у нас человеколюбие. Как воровать здоровья хватает, а как в СИЗО - не хватает! Может хватит дурака гонять ...Экс‑вице‑губернат...
  • Eduard
    Нас это не касается,когда чинуши США для Украины деньги отправляли,то ничего.Пришло время платить за глупые решения!"Ну вот и началос...

Нейросети любят русский: исследование показало, какой язык ИИ понимает лучше

Неожиданное открытие, которое меняет правила игры в мире искусственного интеллекта.

Международная команда исследователей, включая специалистов из Университета Мэриленда и Microsoft, провела масштабное тестирование ведущих больших языковых моделей (БЯМ), таких как Gemini 1.5 Flash, Llama 3 и других. Они оценили, насколько хорошо ИИ справляется с длинными текстами и сложными задачами, используя новый многоязычный бенчмарк OneRuler.

Итоги ошеломили экспертов: польский язык показал наивысшую точность, обойдя даже общепризнанный лидер – английский, который занял лишь шестое место, пишет издание "Вятка-на-сети".

Русский язык в тестах также обошел английский с заметным преимуществом.

Польский — секретный язык ИИ?

В ходе испытаний, охвативших 26 языков (от русского и украинского до японского и суахили), польский язык продемонстрировал впечатляющие 88% точности выполнения команд, особенно при работе с объёмным контекстом (до 128 тысяч токенов). В то время как по мере увеличения длины текста разрыв между языками увеличивался, польский стабильно оставался в лидерах.

В чем причина такого феномена?

Ученые предполагают, что дело не в особенной структуре польского языка, а в дисбалансе обучающих данных. Вероятно, польский язык был представлен в тренировочных корпусах нейросетей непропорционально широко, что и обеспечило ему неожиданное преимущество в тестах.

Шутки и серьёзные выводы

Новость моментально взорвала профессиональные круги и социальные сети. Пользователи уже в шутку предлагают массово изучать польский, чтобы "договариваться" с искусственным интеллектом максимально эффективно.

Тем не менее, эксперты выносят серьезный вердикт разработчикам: необходимо срочно обратить внимание на сбалансированность языковых данных.

Это критически важно, чтобы обеспечить равнокачественную и надёжную работу ИИ на любом языке. Исследование также выявило, что точность может падать на 20% в так называемых кросс-языковых сценариях, когда инструкция и текст написаны на разных языках.

Новый бенчмарк OneRuler — это мощный стимул для разработчиков улучшить свои подходы к обучению мультиязычных моделей, чтобы ИИ мог одинаково уверенно работать с документами на русском, английском, польском и любом другом языке мира.

 

Ссылка на первоисточник
наверх