На информационном ресурсе применяются рекомендательные технологии (информационные технологии предоставления информации на основе сбора, систематизации и анализа сведений, относящихся к предпочтениям пользователей сети "Интернет", находящихся на территории Российской Федерации)

Царьград

7 109 подписчиков

Русские ученые увеличили точность ИИ: новый метод улучшил точность на 15%

Русские специалисты из T-Bank AI Research создали метод, повышающий точность языковых моделей ИИ на 15%. Новый подход, представленный на конференции ICRL в Сингапуре, улучшает качество ответов виртуальных помощников в различных областях, включая медицину и образование.

Русские специалисты из T-Bank AI Research разработали метод обучения крупных языковых моделей (LLM), который способен увеличить точность ответов нейронных сетей (ИИ) до 15%, сообщается в пресс-релизе Т-банк.

Эта методика окажет положительное влияние на качество откликов виртуальных помощников и чат-ботов в различных областях, начиная от образовательной сферы и заканчивая медициной.

"Современные языковые модели, получая данные в больших объемах, теряют качество при продолжительном обучении. Исследовательская группа предложила новый подход, основанный на уже существующих методах Trust Region с некоторыми изменениями, позволившими улучшить процесс обучения LLM. Данный подход увеличивает качество ответов ИИ по пяти основным метрикам", - говорится в сообщении.

Методы Trust Region представляют собой итеративные методы оптимизации, позволяющие адаптивно регулировать область поиска оптимального решения заданной проблемы.

Заявлено, что тексты, созданные моделью с применением этой новой методики, продемонстрировали лучшие результаты по пяти ключевым критериям:

точность связность стиль логическая аргументация насыщенность информацией

Дополнительно LLM смогли уменьшить вероятность случайных ошибок и избежать генерации неправильных текстов, возникающих при узкоспециализированном обучении.

Новый подход отличается простотой в реализации и высокой совместимостью с имеющимися методами. Его суть заключается в регулярном обновлении "настроек по умолчанию" языковой модели (нейросети), что позволяет отмечать важные "ориентиры" на пути развития, способствуя избеганию отклонений и достижению целевой задачи быстрее, подчеркнули в компании.

Разработчики разместили описание своей методики в открытой библиотеке T-банка Turbo Alignment для внедрения и обучения языковых моделей. Результаты проведенного исследования были представлены вчера на международной конференции по обучению представлениям (ICRL), которая проходит в Сингапуре на этой неделе.

 

Ссылка на первоисточник
наверх