Ученые Smart Engines научили ИИ распознавать слово "шиншилла" без языкового контекста. Новая методика улучшает системы распознавания документов и снижает риск "фантазий" нейросетей. Прорыв поможет в обработке паспортов и других официальных документов в России.
Русские специалисты успешно разработали методику, позволяющую искусственному интеллекту (ИИ) узнавать рукописное слово "шиншилла" без применения языкового контекста.
Это достижение способствует уменьшению вероятности возникновения "фантазий" у нейросетей при обработке редко встречаемых слов и совершенствованию систем распознавания документов. Об этом представители компании Smart Engines сообщили РИА Новости.Ученые из компании Smart Engines специально обучили искусственный интеллект распознавать сложные для прочтения рукописные слова, такие как "шиншилла", без привязки к языковому контексту. Новая нейросеть не использует заранее известных слов русского языка, а анализирует исключительно особенности соединений букв на изображениях. Такой подход значительно уменьшает вероятность "фантазий" ИИ при распознавании редко встречающихся лексем, включая собственные имена. Данная разработка значительно повысила уровень систем распознавания паспортов РФ, которые применяют ведущие банки, операторы сотовой связи и другие русские компании, отметили в компании.
По словам специалистов Smart Engines, слово "Шиншилла" является своего рода тестом Тьюринга для систем, занимающихся распознаванием рукописных текстов на кириллице. Это объясняется тем, что при неаккуратном почерке строчные буквы, такие как "ш", "л" и "и", становятся почти неразличимы. Разработчики обучили нейросеть "Да Винчи" на базе 1,2 миллиона строк рукописного текста, с синтезированным равномерным распределением буквенных сочетаний.
Благодаря этому, удается уменьшить риск возникновения "фантазий" у ИИ, что является одной из наиболее распространенных проблем.Генеральный директор Smart Engines, доктор технических наук Владимир Арлазаров, пояснил, что в процессе анализа документов крайне важно избегать "фантазий", так как данные влияют на скоринговые модели и бизнес-процессы в учетных системах. "Основная задача заключалась в создании такого метода ИИ, который смог бы читать сложные рукописные слова, такие как "шиншилла", без языкового контекста. Это необходимо при распознавании документов - паспортов, регистрационных штампов и других, когда требуется считывать исключительно то, что написано, а не то, что могло быть правильнее с точки зрения языка", - добавил Арлазаров.
Свежие комментарии