Русские специалисты из T-Bank AI Research создали метод, повышающий точность языковых моделей ИИ на 15%. Новый подход, представленный на конференции ICRL в Сингапуре, улучшает качество ответов виртуальных помощников в различных областях, включая медицину и образование.
Русские специалисты из T-Bank AI Research разработали метод обучения крупных языковых моделей (LLM), который способен увеличить точность ответов нейронных сетей (ИИ) до 15%, сообщается в пресс-релизе Т-банк.
Эта методика окажет положительное влияние на качество откликов виртуальных помощников и чат-ботов в различных областях, начиная от образовательной сферы и заканчивая медициной.
"Современные языковые модели, получая данные в больших объемах, теряют качество при продолжительном обучении. Исследовательская группа предложила новый подход, основанный на уже существующих методах Trust Region с некоторыми изменениями, позволившими улучшить процесс обучения LLM. Данный подход увеличивает качество ответов ИИ по пяти основным метрикам", - говорится в сообщении.
Методы Trust Region представляют собой итеративные методы оптимизации, позволяющие адаптивно регулировать область поиска оптимального решения заданной проблемы.
Заявлено, что тексты, созданные моделью с применением этой новой методики, продемонстрировали лучшие результаты по пяти ключевым критериям:
точность связность стиль логическая аргументация насыщенность информациейДополнительно LLM смогли уменьшить вероятность случайных ошибок и избежать генерации неправильных текстов, возникающих при узкоспециализированном обучении.
Новый подход отличается простотой в реализации и высокой совместимостью с имеющимися методами. Его суть заключается в регулярном обновлении "настроек по умолчанию" языковой модели (нейросети), что позволяет отмечать важные "ориентиры" на пути развития, способствуя избеганию отклонений и достижению целевой задачи быстрее, подчеркнули в компании.
Разработчики разместили описание своей методики в открытой библиотеке T-банка Turbo Alignment для внедрения и обучения языковых моделей. Результаты проведенного исследования были представлены вчера на международной конференции по обучению представлениям (ICRL), которая проходит в Сингапуре на этой неделе.
Свежие комментарии