Распознавание день в день: как настроить шаблон нового документа без программирования. no-code.. no-code. ocr.. no-code. ocr. ocr-технологии.. no-code. ocr. ocr-технологии. smart engines.. no-code. ocr. ocr-технологии. smart engines. Блог компании Smart Engines.. no-code. ocr. ocr-технологии. smart engines. Блог компании Smart Engines. Дизайн.. no-code. ocr. ocr-технологии. smart engines. Блог компании Smart Engines. Дизайн. дизайнер.. no-code. ocr. ocr-технологии. smart engines. Блог компании Smart Engines. Дизайн. дизайнер. документы.. no-code. ocr. ocr-технологии. smart engines. Блог компании Smart Engines. Дизайн. дизайнер. документы. искусственный интеллект.. no-code. ocr. ocr-технологии. smart engines. Блог компании Smart Engines. Дизайн. дизайнер. документы. искусственный интеллект. настройка формы.. no-code. ocr. ocr-технологии. smart engines. Блог компании Smart Engines. Дизайн. дизайнер. документы. искусственный интеллект. настройка формы. Обработка изображений.. no-code. ocr. ocr-технологии. smart engines. Блог компании Smart Engines. Дизайн. дизайнер. документы. искусственный интеллект. настройка формы. Обработка изображений. распознавание изображений.. no-code. ocr. ocr-технологии. smart engines. Блог компании Smart Engines. Дизайн. дизайнер. документы. искусственный интеллект. настройка формы. Обработка изображений. распознавание изображений. распознавание образов.

Вы прекрасно знаете, что мы в Smart Engines непрерывно совершенствуем наши системы распознавания российского паспорта и других документов. Вместе с этим мы постоянно расширяем список документов, которые могут быть распознаны при помощи наших решений, – и будем делать это и дальше. Но что если бизнесу нужно оперативно настроить распознавание нового корпоративного документа с жесткой структурой? Сегодня такая потребность есть практически у любой организации.

Можно прийти с этой задачей к нам, и мы обязательно поможем. Но есть и альтернативный сценарий – настроить распознавание самостоятельно. Для этого мы выпустили специальный инструмент – дизайнер форм. С ним ждать никого не придется, а добавлять распознавание новых форм можно будет по мере их появления, буквально день в день. О нем мы сегодня и поговорим.

Распознавание день в день: как настроить шаблон нового документа без программирования - 1

Что такое дизайнер форм Smart Engines

Просим любить и жаловать – no-code дизайнер форм от Smart Engines. С ним можно быстро настроить распознавание заявлений, анкет, опросников и других типовых форм всего по одному образцу. Раньше для решения этой задачи бизнес должен был обратиться напрямую к разработчику ПО с просьбой в индивидуальном порядке настроить распознавание нового типа документов. Наш инструмент позволяет сделать это самостоятельно, без привлечения квалифицированных ML-специалистов и программистов.

Помимо очевидных преимуществ в виде экономии времени, ускорения и повышения конфиденциальности бизнес-процессов самостоятельная настройка типовых документов “день в день” открывает еще несколько важных возможностей. А именно:

  • формирование собственной экспертизы в области настройки распознавания документов;

  • независимость, построение команды внедрения продуктов Smart Engines внутри компании;

  • гибкость процессов, оперативная адаптация к изменениям (особенно если нужно уметь распознавать новые формы по мере их появления);

  • полный контроль над результатом (точность и уверенность распознавания можно проверить в режиме реального времени).

Более того, в отличие от представленных на рынке решений наш дизайнер не требует специальной подготовки бланка – нанесения на макет реперных точек или обрамления полей. Для добавления нового типа документа достаточно всего лишь одного примера (скана или фотографии), а интуитивный интерфейс позволит быстро сориентироваться по всем доступным функциям. В общем, теперь справиться с настройкой распознавания типовых документов сможет любой желающий: администратор, аналитик, ответственный сотрудник, кот... Ниже покажем, как это сделать.

Как это выглядит?  

Дизайнер форм представляет собой удобное десктоп-приложение, предназначенное для описания типовых документов и ориентированное на обычного пользователя без каких-либо специальных навыков. Как мы уже сказали, для настройки распознавания документа достаточно всего одного скана или фото каждой из его страниц. Но разумеется, чем больше примеров с различным заполнением имеется, тем точнее можно описать документ – это важно на этапе отладки.

Программа позволяет описать свойства страниц и расположенных на ней объектов, а также способы получения реквизитов документа. Таким образом можно в сжатые сроки настроить распознавание документов любого типа и с произвольным количеством страниц. Полный цикл обработки документа (от его разметки до верификации) занимает несколько минут. Пару лет назад мы уже рассказывали про старую версию дизайнера форм, но с тех пор многое было доработано – и, конечно, интерфейс (о нем ниже). Тем интереснее сравнить наш продукт образца 2023 года с текущей версией.

Распознавание день в день: как настроить шаблон нового документа без программирования - 2

Дизайнер форм позволяет описывать документы с жесткой структурой для их последующего преобразования в конфигурацию системы распознавания. Документ обладает жесткой структурой, если его различные образцы совмещаются на просвет с точностью до заполнения. Иными словами, если удалить все реквизиты, то бланки будут одинаковыми.

Для работы с приложением необходимо создать шаблон — образец страницы документа с описанием содержащихся на ней объектов. Объектами считается все, что присутствует на странице документа: текст, графические элементы, баркоды, линии, чекбоксы и т.д. Примерами объектов может служить ФИО, дата рождения, паспортные данные, подпись и остальные поля и их значения.

Объекты обладают свойствами (или атрибутами). Так, объект типа «текст» имеет свойство «размер шрифта». Свойства являются объективными и не зависят от дальнейшего применения описания документа и особенностей работы систем распознавания. Пользователь создает описание документа исключительно на основе исходного изображения документа, без учета особенностей систем распознавания и прочих задействованных в данном процессе систем.

Один или несколько шаблонов (например, все страницы заявления на загранпаспорт) составляют документ. На уровне документа описываются процессоры — правила преобразования физических полей в реквизиты документа.

Функционал 

Попробуем охватить все возможности, которые предоставляет наш дизайнер форм: 

  • быстрая настройка одностраничных и многостраничных документов;

  • настройка документов с рукописным, печатным, рукопечатным текстом и рукописным текстом, распределенным по клеткам;

  • работа со всеми типами изображений: сканами и фотографиями;

  • создание детального описания каждой из страниц – «шаблонов»;

  • создание нескольких шаблонов одного документа..

Чтобы создать шаблон, нужно загрузить пример изображения страницы, указать расположение углов, а также ее размер. Программа автоматически «вырежет» исходное изображение страницы по указанным границам и размеру, если кроме документа на изображении есть посторонние предметы — например, фрагмент стола или другие бумаги. Дизайнер форм поддерживает самые разные типы полей: тексты, изображения, чекбоксы (зачеркнутые или закрашенные), баркоды (QR, Aztec, PDF-417, DataMatrix, Linear).

Распознавание день в день: как настроить шаблон нового документа без программирования - 3

Теперь немного о дизайне нашего дизайнера. Мы обновили интерфейс приложения, чтобы сделать его еще более понятным и доступным для максимально широкого круга пользователей. Интуитивный WYSIWYG-интерфейс позволяет сделать процесс настройки наглядным – это нужно для наиболее точного описания пользователем объектов. Задаете размер клетки или шрифта – и можно в режиме реального времени свериться с примером, чтобы при необходимости “подогнать” параметр до идеала.

Отображение образца текста с выравниванием по центру и направлением from bottom to top

Отображение образца текста с выравниванием по центру и направлением from bottom to top
Отображение образца разграфки

Отображение образца разграфки

Еще одна фича – текстовая и графическая отладочные консоли. Это дает возможность проверить результаты распознавания на любом этапе настройки. То есть верификацию добавляемой формы можно проводить по ходу составления описания и отслеживать свой прогресс и влияние тех или иных параметров на точность и уверенность распознавания.

При успешном завершении верификации в появившемся окне откроется исходное изображение слева и результаты распознавания справа. В результатах видно, какие именно объекты нашлись, какие реквизиты документа удалось извлечь и их значения.

Результаты верификации

Результаты верификации

При необходимости интерфейс и параметры можно кастомизировать – программа будет выглядеть так, как удобно пользователю. Кроме того, можно сохранять значения параметров, использовать локальную библиотеку документов для сохранения или использования уже готовых документов, экспорта или импорта. А также можно использовать библиотеку преднастроенных документов – для добавления в проект подготовленные нашими специалистами настройки для паспорта РФ, других ДУЛ, банковских, бухгалтерских, страховых и юридических документов и тд. Уж поверьте, тут все настроено идеально.

Есть и еще одна фича – ИИ-ассистент, позволяющий осуществлять автоматический поиск объектов на изображении документа: тексты, чекбоксы, рукопечатные поля, таблицы и баркоды. 

После добавления нужных типов документов пользователь может собрать комплект SDK для внедрения в своей компании новой системы распознавания в мобильные, десктопные и серверные решения. Например, самостоятельно настроить анкету клиента и добавить к ней из “коробки” распознавание паспорта РФ – основного разворота и страницы с пропиской. В общей сложности клиент может добавить документ из более 4000 преднастроенных шаблонов. Среди них паспорт РФ, прописка, ИНН, СНИЛС, свидетельство о рождении, документы стран СНГ и других стран мира, а также банковские, бухгалтерские, страховые и юридические документы. Система обрабатывает фото и сканы поступающих документов в одном потоке, автоматически определяя тип документа. 

В итоге будет готова сборка, которую можно передать in-house разработчикам мобильных приложений для iOS, Android, ОС Аврора и бэк-офисных систем на Windows, Linux, РЕД ОС, Astra Linux, ALT Linux, ОС Эльбрус.

Как это работает

Перейдем от теории к практике. Для примера пошагово продемонстрируем, как в дизайнере форм за пару минут можно настроить анкету на карту лояльности.

Создание нового проекта

Создание нового проекта

1. Создаем новый проект и задаем параметры документа: имя, язык и тип нанесения. В данном случае выбираем handwritten – потому что система распознавания будет иметь дело с рукописью. Затем выбираем размер – он у нас А6 – и альбомную ориентацию. Для создания шаблона загружаем изображение страницы: программа автоматически определит документ на изображении и вырежет его по указанным параметрам. При необходимости углы документа можно подкорректировать вручную.

Указание статических и изменяющихся объектов

Указание статических и изменяющихся объектов

2. Указываем на документе статические объекты, а потом выделяем изменяющиеся поля, указывая их параметры. Быстрее и точнее задать размер текста поможет встроенная возможность визуализации параметров. В параметрах для графы “пол” вместо всего алфавита оставляем только две необходимые буквы М и Ж.

Указание изменяющихся объектов (продолжение)

Указание изменяющихся объектов (продолжение)

Для даты рождения выбираем digits в наборе символов и добавляем точку в алфавите. Для поля с номером телефона вместо точки добавляем “+”. В наборе символов для поля “почта” указываем email (как это ни удивительно). А при выделении подписи выбираем инструмент “графика”.

Верификация проекта

Верификация проекта

3. Верифицируем! Зеленый цвет говорит о том, что система уверена в своем ответе. Проверяем распознавание на анкете с другим заполнением – и поздравляем вас с успешной настройкой распознавания!

Хотите убедиться в скорости процесса? Посмотрите наш видео-туториал по настройке дизайнера форм!

Что в итоге?

Нам удалось вывести работу с технологиями распознавания документов на массовый уровень и сделать процесс настройки шаблонов документов доступным для широкого круга обычных пользователей. Дизайнер форм Smart Engines дает свободу действий для быстрой реализации распознавания новых форм на стороне клиента. Теперь настройка распознавания новых типов документов стала доступна полностью in-house. 

P.S. Подписывайтесь на наш Telegram-канал “ИИ нефильтрованый”!

Автор: SmartEngines

Источник

Рейтинг@Mail.ru
Rambler's Top100