etence.ocr

Автоматическое распознавание документов

Group 512569.svg

О продукте

Информационная система etence.ocr представляет собой программный продукт для распознавания информации со скан-изображений и хранения пакетов документов различных типов .

1.png

Как это работает

Group 34316.svg

Продукт принмает от сотрудника или по API скан документа

Group 34317.svg

С помощью OCR, нейронных сетей и собственных алгоритмов из документов извлекаются данные

Group 34317.svg

Полученные данные в структурированном виде становятся доступны в интерфейсе или передаются по API

ДЛЯ КОГО

Подойдет всем, кто работает с потоком клиентских, бухгалтерских, кадровых и финансовых документов

defice.svg

Ваши клиенты заполняют анкеты?

 

defice.svg

Вы хотите облегчить работу бэк-офиса?

defice.svg

Задумались об интеграции в свою CRM?

Решения, которые были реализованы

analysis.svg

Анализ и обработка входящего потока документов (в том числе документов без наличия формализованной структуры)

doc.svg

Проверка качества и правильности заполнения входящего потока документов
 

classify.svg

Классификация документов

 

analys2.svg

Извлечение данных на основе технологий машинного обучения
 

done.svg

Проверка корректности полученной информации
 

cube.svg

Генерация производной информации и передача требуемой информации во внешние системы

Распознаём все виды документов

Решение позволяет переводить в цифровой формат и быстро обрабатывать большое количество материалов, в том числе паспорта и договоры. Адаптируем сервис под бизнес-процессы вашей компании — расширяем спектр обрабатываемых документов индивидуально.

Документы физического лица

  • Паспорт
  • СНИЛС, ИНН
  • Военный билет
  • Заграничный паспорт РФ
  • Водительское удостоверение, СТС, ПТС
  • Вид на жительство
  • ID иностранных граждан
  • Свидетельство о рождении, браке и разводе
  • Трудовая книжка
  • Справка 2-НДФЛ или по форме банка

Бухгалтерские документы

  • УПД
  • Счёт-фактура
  • Товарная накладная
  • Счёт, акт и чек

Неструктурированные

  • Договор
  • Спецификации
  • Письма
Group 512561.png
Group 512562.png
Group 512564.png

Применение

Сервис распознавания и обработки подходит для любой отрасли: от страховых и финансовых организаций до торговых компаний. Сервис способен сканировать и распознавать данные из различных источников. 

finance.svg

Банки и финансовые организации

doc2.svg

Страховые компании

taxi.svg

Такси и каршеринг

audit.svg

Бухгалтерские и аудиторские службы

travel.svg

Туризм

it.svg

IT-платформы

buildings.svg

Недвижимость

law.svg

Юридические компании

ed.svg

Образовательные организации

Преимущества от внедрения

Check.svg

Ускорение процессов

Обработка занимает минуты без длинных ожиданий для клиента

Check.svg

Экономия

Сокращаем время и деньги на ручной труд

Check.svg

Быстрая интеграция

У нас есть всё для установки из коробки API (REST API, SOAP) и WEB-интерфейс

Check.svg

Минимизация ошибок

Автоматизация позволяет свести к минимуму ошибки операторов 

Модули системы

Интерфейс сотрудника

Подсистема обработки изображений

Подсистема управления бизнес-процессами

Очередь обработки пакетов документов

Интерфейс сотрудника

Подсистема предоставляет графический интерфейс для работы с пакетами документов и выполнения административных функций по настройке Системы.

Фильтрация

Для взаимодействия с большим набором обрабатываемых пакетов пользователям предоставляется функционал фильтрации, сортировки и полнотекстового поиска (включающего в себя сквозной поиск по распознанному со скан-изображений тексту) по всем загруженным в Систему пакетам документов.

Frame 512622.png
Frame 512571.png

Контроль данных пользователем

Обработанные Системой документы могут быть проверены пользователями Системы на соответствие обработки с требуемыми метриками качества извлечения информации и преобразования скан-изображений.

При нахождении несоответствий, документы могут быть отмечены специальными маркерами, влияющими на дальнейшие стадии бизнес-процесса обработки пакета.

пакет таблица.png

Подсистема обработки документов

Подсистема предназначена для автоматического распознавания и предобработки документов на скан-изображениях.

процесс большой.png

Добавленные в Систему пакеты документов добавляются в очередь обработки. Согласно заданным при создании пакетов документов приоритетам, Система выполняет следующие задачи

defice.svg

Улучшение исходных изображений: увеличение контраста, яркости, подавление шума

defice.svg

Обрезка и поворот изображений

defice.svg

Разбиение многостраничных документов на одностраничные

defice.svg

Разбиение изображений, содержащих несколько документов, на отдельные документы

defice.svg

Классификация каждого полученного документа согласно словарю предопределенных типов документов

defice.svg

Извлечение текстовых данных с изображения

defice.svg

Извлечение ключевых слов, требуемых для конкретного типа документов согласно словарю

defice.svg

Наложение на исходные скан-изображения текстового слоя


Подсистема управления бизнес-процессами


Подсистема выполняет функции управления и конфигурирования выполнения задач другими модулями Системы. Так как Система предполагает использование в качестве встраиваемого решения в существующие бизнес-процессы, то конфигурация выполняемых Системой функций может настраиваться в соответствии с работой существующих решений и позволяет изменять следующие настройки

Настройка входных данных системы

  • Автоматическое получение данных из внешних систем
  • Получение данных из внешних систем по заданному расписанию
  • Получение данных из внешних систем при наступлении событий во внешней системе
  • Ручное добавление данных
Процесс1.png
Процесс2.png

Настройка событий обработки пакетов

  • Отправка сообщений о наступлении события во внешние системы
  • Отправка e-mail уведомлений о наступлении событий
  • Автоматическое изменение пакетов документов при наступлении событий
  • Отправка промежуточной информации во внешние системы
  • Настройка необходимости ручной верификации обработки пакетов

Настройка результатов обработки пакетов документов

  • Автоматическая отправка результатов после окончания обработки
  • Рассылка e-mail оповещений с результатами обработки
  • Ручная обработка результатов
Процесс3.png

Очередь обработки пакетов документов


Подсистема реализует интерфейс организации и манипулирования данными в режиме реально времени. Очередь обработки пакетов документов выполняет следующие задачи:

  • Выбор наиболее приоритетных пакетов документов из очереди
  • Балансировка нагрузки
  • Синхронизация выполнения параллельных процессов обработки пакетов
  • Оптимизация использования аппаратных ресурсов

Требование к аппаратно-программному обеспечению
 

Взаимодействие с внешними источниками

Система в базовом варианте не взаимодействует со сторонними системами и не предполагает постоянного доступа к сети Интернет для корректной работы. Подключение необходимо на моменте развертывания экземпляра Системы.
Интеграция Системы с различными внешними системами возможна как с использованием постоянного подключения к сети Интернет, так и по локальной сети. Возможно развертывание, предполагающее использование прокси-сервера.

 

Серверная часть системы

Использует следующие технологии и может быть развернута в облачной инфраструктуре Kubernetes (k8s) / Docker:

  • СУБД PostgreSQL
  • СУБД Elasticsearch
  • Брокер сообщений RabbitMQ
  • Система оркестрации бизнес-процессов Zeebe
  • Объектное хранилище Minio (S3)
  • Хранилище данных типа "ключ-значение" Redis

Клиентская часть системы

Для работы с клиентской частью системы к рабочим станциям необходим только браузер.