Автоматизация OCR

Распознать по шаблону

Распознает заданный документ по шаблону. Этот блок работает с шаблонами, созданными с помощью кнопки «Извлечь по шаблону» на панели инструментов Sherpa Designer.

http://sherparpa.ru/videos/ru/recognizetemplates.mp4

Путь к файлу

[Текст] Путь к файлу. Поддерживаемые форматы файлов: .png;.jpg;.pdf. Файл pdf может быть многостраничным

Путь к файлу шаблона

[Текст/Список] Путь к файлу шаблона для распознавания. При указании списка файлов шаблонов для распознавания будут последовательно использоваться каждый файл пока распознавание не закончится успешно. Если ни один из шаблонов не подойдет для документа, то будет сгенерировано исключение с ошибкой первого шаблона из списка. При использовании списка возможно увеличение скорости обработки нескольких шаблонов если параметры распознавания страницы у них одинаковые. Этот блок работает с шаблонами, созданными с помощью кнопки "Извлечь по шаблону" на панели инструментов Sherpa Designer

Номер страницы

[Текст] Номер страницы в многостраничном pdf файле. Если есть якорь LastPage, то распознавание будет идти с заданного номера до страницы пока его не найдет. Если этого якоря нет, то распознается только заданная страница

Заменить модуль

[Текст] Позволяет при распознавании заменить указанный модуль в шаблоне на заданный в блоке. Возможные значения: TesseractOCR; YandexVision; MicrosoftOCR; AbbyyOCR; FineReader; OCRSpace

Заменить масштаб

[Число] Задается новый масштаб при распознавании шаблоном. Если значение не задано, то используется масштаб из настроек шаблона, иначе задается указанный в этом свойстве масштаб

Заменить язык распознавания

[Текст] Позволяет при распознавании заменить указанный язык в шаблоне на заданный в блоке.

Заменить размер ячейки по горизонтали

[Число] Задается новый размер ячейки по горизонтали при распознавании шаблоном. Если значение не задано, то используется размер ячейки из настроек шаблона, иначе задается указанный в этом свойстве размер

Заменить размер ячейки по вертикали

[Число] Задается новый размер ячейки по вертикали при распознавании шаблоном. Если значение не задано, то используется размер ячейки из настроек шаблона, иначе задается указанный в этом свойстве размер

Добавлять процент "уверенности" в таблицы

При включении параметра в каждую ячейку таблицы будет записывать не текст, а объект CellData. Из объекта можно будет извлечь текст с помощью свойства Text, а так же процент "уверенности" с помощью свойства Confidence

Игнорировать ошибки якорей

Если якори (любые) не будут найдены, то ошибки генерироваться не будет. В этом случае область якоря считается нулевой

Обрабатывать все страницы

При включении опции будет происходить обработка всех страниц в документе. Этот режим не делает проверку якоря LastPage

Атрибуты

[Словарь] Словарь с атрибутами документа. Например: "Номер документа", "ИНН поставщика" и др. В атрибуты добавляется параметр CountPage, который соответствует количеству страниц, участвующих при распознавании шаблоном

Таблицы

[Список Таблиц Данных] Возвращается список таблиц данных. Список формируется по данным из шаблона

Области якорей

[Словарь] Словарь с найденными якорями. Ключом словаря служит ID якоря, а значением прямоугольник, обозначающий его положение на странице. При этом DPI страницы принимается как 300

Данные атрибутов

[Словарь] Словарь с найденными атрибутами. Ключом словаря служит имя атрибута, а значением объект с данными атрибутов. Объект содержит прямоугольник, обозначающий положение атрибута на странице. При этом DPI страницы принимается как 300. Так же объект содержит значение Confidence, указывающее "Уверенность" в распознавании. Доступно для Tesseract и YandexVision и имеет значение от 0 до 100

Индекс шаблона

[Число] Индекс распознанного шаблона. Данное свойство актуально если в свойстве "Путь к файлу шаблона" задается список. Нумерация начинается с нуля

Уровень обработки

Выбор уровня обработки ошибок. Возможные значения: "Default" - по умолчанию; "Ignore" - ошибки игнорируются; "Handle" - ошибки обрабатываются. Если выбрано значение "Default", то будет использоваться значение блока "Старт" данной диаграммы

Уровень сообщений

Выбор уровня сообщений, которые будут выводить блоки при работе. Возможные значения: "Default" - по умолчанию; "Release" - вывод отключен; "Debug" - вывод основной информации; "Detailed" - вывод подробной информации. Если выбрано значение "Default", то будет использоваться значение блока "Старт" данной диаграммы

Текст ошибки

[Текст] Возвращает подробную информацию об ошибке в случае некорректного выполнения работы блока

Клик по распознанному тексту

Данный блок позволяет во время разработки робота задать область экрана (окно приложения, панель или другой элемент внутри окна), одно или несколько слов, и записать координаты клика относительно расположения этих слов внутри области экрана, а затем во время работы сценария робот распознает весь текст из заданной области экрана с помощью технологии OCR, найдет аналогичный участок экрана с заданным текстом, а затем произведет клик на точке с запомненными ранее координатами относительно верхнего левого угла найденного текста. Вы можете выбрать один из нескольких доступных оффлайновых и онлайновых модулей OCR. Этот блок особенно полезен для клика по элементам управления в приложениях и на веб-страницах, в которых не удаётся найти стабильные селекторы для требуемого элемента, или же если окно приложения выглядит для операционной системы как одна картинка (например в случае работы с приложением через средства удаленного доступа).

Селектор

[Селектор] Идентификатор окна или элемента пользовательского интерфейса, в пределах которого будет производиться распознавание текста

Действие

Выбор действия: левый клик, двойной клик, правый клик, навести курсор

Координата X

[Число] Горизонтальная координата верхнего левого угла области выбранного окна или элемента управления, в которой будет производиться захват и распознавания изображения

Координата Y

[Число] Вертикальная координата верхнего левого угла области выбранного окна или элемента управления, в которой будет производиться захват и распознавания изображения

Ширина

[Число] Ширина изображения для захвата и распознавания в пикселах

Высота

[Число] Высота изображения для захвата и распознавания в пикселах

Координата клика X

[Число] Горизонтальное смещение координаты клика относительно левого верхнего угла найденного блока текста на экране

Координата клика Y

[Число] Вертикальное смещение координаты клика относительно левого верхнего угла найденного блока текста на элементе

Язык текста

Выбор языка текста.

Поиск текста

[Текст] Поиск текста в распознанном изображении. Если задано, то клик мышкой будет произведен относительно левого верхнего угла найденного блока текста, иначе - относительно верхнего левого угла заданной координатами области экрана

Процент совпадения

[Число] Процент совпадения искомого текста, от 0 до 100. Уменьшите это число, чтобы искомый текст находился даже в случае неточностей в распознавании текста. Слишком низкое значение процента приведет к совпадению с ненужными словами

Индекс совпадения

[Число] Если искомый текст будет найден в указанной области экрана несколько раз, то можно указать порядковый номер совпадения, которое нужно использовать для клика. Нумерация начинается с 1

ThumbImage

Thumb Image

ID процесса

[Ссылка] Переменная, в которой хранится идентификатор процесса. Указывает, с каким приложением необходимо работать. Если указанное приложение свернуто или его окно закрыто другими окнами, то оно будет выведено на передний план. При работе с браузерами ID процесса дополнительно указывает на конкретную вкладку браузера, с которой должен работать блок. Если свойство оставить пустым, либо если переменная ID процесса не была ранее присвоена в момент запуска приложения или открытия браузера, приложение и вкладка браузера будут определены из содержимого соответствующей строки селектора. ID процесса может быть получен, например, с помощью блоков Запустить приложение или Получить процесс.

Модуль

Выбор модуля OCR, применяемого при распознавании изображения в текст

Увеличение

[Число] Значение, указывающее во сколько раз нужно увеличить изображение перед распознаванием. В зависимости от используемого движка, увеличение изображения в 2 или 3 раза помогает увеличить качество распознавания

Симуляция движения

При включении будет симулироваться движение курсора мышки от текущей позиции до рассчитанной блоком точки

Уровень обработки

Выбор уровня обработки ошибок. Возможные значения: "Default" - по умолчанию; "Ignore" - ошибки игнорируются; "Handle" - ошибки обрабатываются. Если выбрано значение "Default", то будет использоваться значение блока "Старт" данной диаграммы

Уровень сообщений

Выбор уровня сообщений, которые будут выводить блоки при работе. Возможные значения: "Default" - по умолчанию; "Release" - вывод отключен; "Debug" - вывод основной информации; "Detailed" - вывод подробной информации. Если выбрано значение "Default", то будет использоваться значение блока "Старт" данной диаграммы

Текст ошибки

[Текст] Возвращает подробную информацию об ошибке в случае некорректного выполнения работы блока

Клик по распознанному тексту с элемента

Данный блок позволяет во время разработки робота задать область экрана (окно приложения, панель или другой элемент внутри окна), одно или несколько слов, и записать координаты клика относительно расположения этих слов внутри области экрана, а затем во время работы сценария робот распознает весь текст из заданной области экрана с помощью технологии OCR, найдет аналогичный участок экрана с заданным текстом, а затем произведет клик на точке с запомненными ранее координатами относительно верхнего левого угла найденного текста. Вы можете выбрать один из нескольких доступных оффлайновых и онлайновых модулей OCR. Этот блок особенно полезен для клика по элементам управления в приложениях и на веб-страницах, в которых не удаётся найти стабильные селекторы для требуемого элемента, или же если окно приложения выглядит для операционной системы как одна картинка (например в случае работы с приложением через средства удаленного доступа).

Селектор

[Селектор] Идентификатор окна или элемента пользовательского интерфейса, в пределах которого будет производиться распознавание текста

Действие

Выбор действия: левый клик, двойной клик, правый клик, навести курсор

Координата клика X

[Число] Горизонтальное смещение координаты клика относительно левого верхнего угла найденного блока текста на экране

Координата клика Y

[Число] Вертикальное смещение координаты клика относительно левого верхнего угла найденного блока текста на элементе

Язык текста

Выбор языка текста

Поиск текста

[Текст] Поиск текста в распознанном изображении. Если задано, то клик мышкой будет произведен относительно левого верхнего угла найденного блока текста, иначе - относительно верхнего левого угла заданной координатами области экрана

Процент совпадения

[Число] Процент совпадения искомого текста, от 0 до 100. Уменьшите это число, чтобы искомый текст находился даже в случае неточностей в распознавании текста. Слишком низкое значение процента приведет к совпадению с ненужными словами

Индекс совпадения

[Число] Если искомый текст будет найден в указанной области экрана несколько раз, то можно указать порядковый номер совпадения, которое нужно использовать для клика. Нумерация начинается с 1

ThumbImage

Thumb Image

ID процесса

[Ссылка] Переменная, в которой хранится идентификатор процесса. Указывает, с каким приложением необходимо работать. Если указанное приложение свернуто или его окно закрыто другими окнами, то оно будет выведено на передний план. При работе с браузерами ID процесса дополнительно указывает на конкретную вкладку браузера, с которой должен работать блок. Если свойство оставить пустым, либо если переменная ID процесса не была ранее присвоена в момент запуска приложения или открытия браузера, приложение и вкладка браузера будут определены из содержимого соответствующей строки селектора. ID процесса может быть получен, например, с помощью блоков Запустить приложение или Получить процесс.

Модуль

Выбор модуля OCR, применяемого при распознавании изображения в текст

Увеличение

[Число] Значение, указывающее во сколько раз нужно увеличить изображение перед распознаванием. В зависимости от используемого движка, увеличение изображения в 2 или 3 раза помогает увеличить качество распознавания

Время ожидания

[Число] Предельное время ожидания появления элемента в секундах

Симуляция движения

При включении будет симулироваться движение курсора мышки от текущей позиции до рассчитанной блоком точки

Уровень обработки

Выбор уровня обработки ошибок. Возможные значения: "Default" - по умолчанию; "Ignore" - ошибки игнорируются; "Handle" - ошибки обрабатываются. Если выбрано значение "Default", то будет использоваться значение блока "Старт" данной диаграммы

Уровень сообщений

Выбор уровня сообщений, которые будут выводить блоки при работе. Возможные значения: "Default" - по умолчанию; "Release" - вывод отключен; "Debug" - вывод основной информации; "Detailed" - вывод подробной информации. Если выбрано значение "Default", то будет использоваться значение блока "Старт" данной диаграммы

Текст ошибки

[Текст] Возвращает подробную информацию об ошибке в случае некорректного выполнения работы блока

Распознать текст с экрана

Данный блок позволяет во время разработки робота задать область экрана (окно приложения, панель или другой элемент внутри окна), а затем во время работы сценария робот распознает весь текст из заданной области экрана с помощью технологии OCR и записывает результат распознавания в указанную текстовую переменную. Вы можете выбрать один из нескольких доступных оффлайновых и онлайновых модулей OCR.

Селектор

[Селектор] Идентификатор окна или элемента пользовательского интерфейса, в пределах которого будет производиться распознавание текста

Координата X

[Число] Горизонтальная координата верхнего левого угла области выбранного окна или элемента управления, в которой будет производиться захват и распознавания изображения

Координата Y

[Число] Вертикальная координата верхнего левого угла области выбранного окна или элемента управления, в которой будет производиться захват и распознавания изображения

Ширина

[Число] Ширина изображения для захвата и распознавания в пикселах

Высота

[Число] Высота изображения для захвата и распознавания в пикселах

Язык текста

Выбор языка текста

ThumbImage

Thumb Image

Результат

[Текст] В указанную здесь переменную будет помещен распознанный текст

ID процесса

[Ссылка] Переменная, в которой хранится идентификатор процесса. Указывает, с каким приложением необходимо работать. Если указанное приложение свернуто или его окно закрыто другими окнами, то оно будет выведено на передний план. При работе с браузерами ID процесса дополнительно указывает на конкретную вкладку браузера, с которой должен работать блок. Если свойство оставить пустым, либо если переменная ID процесса не была ранее присвоена в момент запуска приложения или открытия браузера, приложение и вкладка браузера будут определены из содержимого соответствующей строки селектора. ID процесса может быть получен, например, с помощью блоков Запустить приложение или Получить процесс.

Модуль

Выбор модуля OCR, применяемого при распознавании изображения в текст

Метод разделения

[Текст] Распознанный текст может быть автоматически разделен на участки, через запятую. Метод разделения: 0 - Использовать указанный разделитель блоков 1 - Автоматическое разделение (только для Yandex) 2 - Разделять по пустым интервалам длиннее указанного числа символов

Разделитель блоков

[Число] Шестнадцатиричный код символа, который будет считаться разделителем блоков. Например, пробел имеет код 20, знак табуляции - код 9. Используется при выборе метода разделения 0

Количество символов

[Число] Длина пустого пространства в распознанном тексте, измеренная в количестве символов, которая используется при выборе метода разделения текста на блоки 2

Увеличение

[Число] Значение, указывающее во сколько раз нужно увеличить изображение перед распознаванием. В зависимости от используемого движка, увеличение изображения в 2 или 3 раза помогает увеличить качество распознавания

Уровень обработки

Выбор уровня обработки ошибок. Возможные значения: "Default" - по умолчанию; "Ignore" - ошибки игнорируются; "Handle" - ошибки обрабатываются. Если выбрано значение "Default", то будет использоваться значение блока "Старт" данной диаграммы

Уровень сообщений

Выбор уровня сообщений, которые будут выводить блоки при работе. Возможные значения: "Default" - по умолчанию; "Release" - вывод отключен; "Debug" - вывод основной информации; "Detailed" - вывод подробной информации. Если выбрано значение "Default", то будет использоваться значение блока "Старт" данной диаграммы

Текст ошибки

[Текст] Возвращает подробную информацию об ошибке в случае некорректного выполнения работы блока

Распознать текст с элемента

Данный блок позволяет во время разработки робота задать область экрана (окно приложения, панель или другой элемент внутри окна), а затем во время работы сценария робот распознает весь текст из заданной области экрана с помощью технологии OCR и записывает результат распознавания в указанную текстовую переменную. Вы можете выбрать один из нескольких доступных оффлайновых и онлайновых модулей OCR.

Селектор

[Селектор] Идентификатор окна или элемента пользовательского интерфейса, в пределах которого будет производиться распознавание текста

Язык текста

Выбор языка текста

ThumbImage

Thumb Image

Результат

[Текст] В указанную здесь переменную будет помещен распознанный текст

ID процесса

[Ссылка] Переменная, в которой хранится идентификатор процесса. Указывает, с каким приложением необходимо работать. Если указанное приложение свернуто или его окно закрыто другими окнами, то оно будет выведено на передний план. При работе с браузерами ID процесса дополнительно указывает на конкретную вкладку браузера, с которой должен работать блок. Если свойство оставить пустым, либо если переменная ID процесса не была ранее присвоена в момент запуска приложения или открытия браузера, приложение и вкладка браузера будут определены из содержимого соответствующей строки селектора. ID процесса может быть получен, например, с помощью блоков Запустить приложение или Получить процесс.

Модуль

Выбор модуля OCR, применяемого при распознавании изображения в текст

Метод разделения

[Текст] Распознанный текст может быть автоматически разделен на участки, через запятую. Метод разделения: 0 - Использовать указанный разделитель блоков 1 - Автоматическое разделение (только для Yandex) 2 - Разделять по пустым интервалам длиннее указанного числа символов

Разделитель блоков

[Число] Шестнадцатиричный код символа, который будет считаться разделителем блоков. Например, пробел имеет код 20, знак табуляции - код 9. Используется при выборе метода разделения 0

Количество символов

[Число] Длина пустого пространства в распознанном тексте, измеренная в количестве символов, которая используется при выборе метода разделения текста на блоки 2

Увеличение

[Число] Значение, указывающее во сколько раз нужно увеличить изображение перед распознаванием. В зависимости от используемого движка, увеличение изображения в 2 или 3 раза помогает увеличить качество распознавания

Время ожидания

[Число] Предельное время ожидания появления элемента в секундах

Уровень обработки

Выбор уровня обработки ошибок. Возможные значения: "Default" - по умолчанию; "Ignore" - ошибки игнорируются; "Handle" - ошибки обрабатываются. Если выбрано значение "Default", то будет использоваться значение блока "Старт" данной диаграммы

Уровень сообщений

Выбор уровня сообщений, которые будут выводить блоки при работе. Возможные значения: "Default" - по умолчанию; "Release" - вывод отключен; "Debug" - вывод основной информации; "Detailed" - вывод подробной информации. Если выбрано значение "Default", то будет использоваться значение блока "Старт" данной диаграммы

Текст ошибки

[Текст] Возвращает подробную информацию об ошибке в случае некорректного выполнения работы блока

Распознать текст из изображения

Распознавание текста из указанного графического файла. Вы можете выбрать один из нескольких доступных оффлайновых и онлайновых модулей OCR. Поддерживаемые форматы изображений: .png, .jpeg, .jpg, .bmp.

Селектор

[Селектор] Для интерактивного выбора области изображения воспользуйтесь кнопкой Запись в окне редактирования селектора

Путь к файлу

[Текст] Путь к файлу изображения

Язык текста

Выбор языка текста

Модуль

Выбор модуля OCR, применяемого при распознавании изображения в текст

Метод разделения

[Текст] Распознанный текст может быть автоматически разделен на участки, через запятую. Метод разделения: 0 - Использовать указанный разделитель блоков 1 - Автоматическое разделение (только для Yandex) 2 - Разделять по пустым интервалам длиннее указанного числа символов

Разделитель блоков

[Число] Шестнадцатиричный код символа, который будет считаться разделителем блоков. Например, пробел имеет код 20, знак табуляции - код 9. Используется при выборе метода разделения 0

Количество символов

[Число] Длина пустого пространства в распознанном тексте, измеренная в количестве символов, которая используется при выборе метода разделения текста на блоки 2

Увеличение

[Число] Значение, указывающее во сколько раз нужно увеличить изображение перед распознаванием. В зависимости от используемого движка и разрешения исходного изображения, увеличение изображения в 2 или 3 раза помогает увеличить качество распознавания

Автоповорот страницы

При распознавании автоматически поворачивать страницу

Результат

[Текст] В указанную здесь переменную будет помещен распознанный текст

Уровень обработки

Выбор уровня обработки ошибок. Возможные значения: "Default" - по умолчанию; "Ignore" - ошибки игнорируются; "Handle" - ошибки обрабатываются. Если выбрано значение "Default", то будет использоваться значение блока "Старт" данной диаграммы

Уровень сообщений

Выбор уровня сообщений, которые будут выводить блоки при работе. Возможные значения: "Default" - по умолчанию; "Release" - вывод отключен; "Debug" - вывод основной информации; "Detailed" - вывод подробной информации. Если выбрано значение "Default", то будет использоваться значение блока "Старт" данной диаграммы

Текст ошибки

[Текст] Возвращает подробную информацию об ошибке в случае некорректного выполнения работы блока

Распознавание CAPTCHA

Распознавание блоков CAPTCHA. Исходными данными являются изображения.

Имя и путь к файлу

[Текст] Имя и путь к файлу изображения для распознавания. Поддерживаются форматы: .png, .jpeg, .jpg

Результат

[Текст] Результат распознавания

Уровень обработки

Выбор уровня обработки ошибок. Возможные значения: "Default" - по умолчанию; "Ignore" - ошибки игнорируются; "Handle" - ошибки обрабатываются. Если выбрано значение "Default", то будет использоваться значение блока "Старт" данной диаграммы

Уровень сообщений

Выбор уровня сообщений, которые будут выводить блоки при работе. Возможные значения: "Default" - по умолчанию; "Release" - вывод отключен; "Debug" - вывод основной информации; "Detailed" - вывод подробной информации. Если выбрано значение "Default", то будет использоваться значение блока "Старт" данной диаграммы

Текст ошибки

[Текст] Возвращает подробную информацию об ошибке в случае некорректного выполнения работы блока

Распознать Паспорт

Распознавание документа «Паспорт». Поддерживаемые форматы: .pdf, .png, .jpeg, .jpg.

Путь к файлу

[Текст] Путь к файлу. Файл pdf может быть многостраничным

Режим работы

Выберите режим работы блока. Online - распознавание через сервис Yandex; Offline - позволяет распознать с помощью оффлайн OCR движков

Язык заголовков

Язык заголовков атрибутов. Возможные значения: en - на английском языке, ru - на русском

Модуль

Выбор модуля OCR, применяемого при распознавании

Масштаб

[Число] Коэффициент масштабирования изображения. Значение 1 = 100%

Атрибуты

[Словарь] Словарь с атрибутами документа. Например: "Номер паспорта", "Дата выдачи" и др.

Уровень обработки

Выбор уровня обработки ошибок. Возможные значения: "Default" - по умолчанию; "Ignore" - ошибки игнорируются; "Handle" - ошибки обрабатываются. Если выбрано значение "Default", то будет использоваться значение блока "Старт" данной диаграммы

Уровень сообщений

Выбор уровня сообщений, которые будут выводить блоки при работе. Возможные значения: "Default" - по умолчанию; "Release" - вывод отключен; "Debug" - вывод основной информации; "Detailed" - вывод подробной информации. Если выбрано значение "Default", то будет использоваться значение блока "Старт" данной диаграммы

Текст ошибки

[Текст] Возвращает подробную информацию об ошибке в случае некорректного выполнения работы блока

Распознать ТОРГ-12

Распознавание документа «Товарная накладная (ТОРГ-12)». Поддерживаемые форматы: .pdf, .png, .jpeg, .jpg.

Путь к файлу

[Текст] Путь к файлу. Поддерживаемые форматы файлов: .png;.jpg;.pdf. Файл pdf может быть многостраничным

Номер страницы

[Текст] Номер страницы в многостраничном pdf файле. Если есть якорь LastPage, то распознавание будет идти с заданного номера до страницы пока его не найдет. Если этого якоря нет, то распознается только заданная страница

Постобработка

При включении будет производиться постобработка данных. Например извлекаются ИНН, КПП

Заменить модуль

[Текст] Позволяет при распознавании заменить указанный модуль в шаблоне на заданный в блоке. Возможные значения: TesseractOCR; YandexVision; MicrosoftOCR; AbbyyOCR; FineReader; OCRSpace

Заменить масштаб

[Число] Задается новый масштаб при распознавании шаблоном. Если значение не задано, то используется масштаб из настроек шаблона, иначе задается указанный в этом свойстве масштаб

Атрибуты

[Словарь] Словарь с атрибутами документа. Например: "Номер документа", "ИНН поставщика" и др. В атрибуты добавляется параметр CountPage, который соответствует количеству страниц, участвующих при распознавании шаблоном

Данные

[Таблица Данных] Таблица, содержащая данные из документа

Уровень обработки

Выбор уровня обработки ошибок. Возможные значения: "Default" - по умолчанию; "Ignore" - ошибки игнорируются; "Handle" - ошибки обрабатываются. Если выбрано значение "Default", то будет использоваться значение блока "Старт" данной диаграммы

Уровень сообщений

Выбор уровня сообщений, которые будут выводить блоки при работе. Возможные значения: "Default" - по умолчанию; "Release" - вывод отключен; "Debug" - вывод основной информации; "Detailed" - вывод подробной информации. Если выбрано значение "Default", то будет использоваться значение блока "Старт" данной диаграммы

Текст ошибки

[Текст] Возвращает подробную информацию об ошибке в случае некорректного выполнения работы блока

Распознать УПД

Распознавание документа «Универсальный передаточный документ (УПД)». Поддерживаемые форматы: .pdf, .png, .jpeg, .jpg.

Путь к файлу

[Текст] Путь к файлу. Поддерживаемые форматы файлов: .png;.jpg;.pdf. Файл pdf может быть многостраничным

Номер страницы

[Текст] Номер страницы в многостраничном pdf файле. Если есть якорь LastPage, то распознавание будет идти с заданного номера до страницы пока его не найдет. Если этого якоря нет, то распознается только заданная страница

Постобработка

При включении будет производиться постобработка данных. Например извлекаются ИНН, КПП

Заменить модуль

[Текст] Позволяет при распознавании заменить указанный модуль в шаблоне на заданный в блоке. Возможные значения: TesseractOCR; YandexVision; MicrosoftOCR; AbbyyOCR; FineReader; OCRSpace

Заменить масштаб

[Число] Задается новый масштаб при распознавании шаблоном. Если значение не задано, то используется масштаб из настроек шаблона, иначе задается указанный в этом свойстве масштаб

Атрибуты

[Словарь] Словарь с атрибутами документа. Например: "Номер документа", "ИНН поставщика" и др. В атрибуты добавляется параметр CountPage, который соответствует количеству страниц, участвующих при распознавании шаблоном

Данные

[Таблица Данных] Таблица, содержащая данные из документа

Уровень обработки

Выбор уровня обработки ошибок. Возможные значения: "Default" - по умолчанию; "Ignore" - ошибки игнорируются; "Handle" - ошибки обрабатываются. Если выбрано значение "Default", то будет использоваться значение блока "Старт" данной диаграммы

Уровень сообщений

Выбор уровня сообщений, которые будут выводить блоки при работе. Возможные значения: "Default" - по умолчанию; "Release" - вывод отключен; "Debug" - вывод основной информации; "Detailed" - вывод подробной информации. Если выбрано значение "Default", то будет использоваться значение блока "Старт" данной диаграммы

Текст ошибки

[Текст] Возвращает подробную информацию об ошибке в случае некорректного выполнения работы блока

Распознать Акт сверки

Распознавание документа «Акт сверки». Поддерживаемые форматы: .pdf, .png, .jpeg, .jpg.

Путь к файлу

[Текст] Путь к файлу. Поддерживаемые форматы файлов: .png;.jpg;.pdf. Файл pdf может быть многостраничным

Номер страницы

[Текст] Номер страницы в многостраничном pdf файле. Если есть якорь LastPage, то распознавание будет идти с заданного номера до страницы пока его не найдет. Если этого якоря нет, то распознается только заданная страница

Постобработка

При включении будет производиться постобработка данных. Например извлекаются ИНН, КПП

Заменить модуль

[Текст] Позволяет при распознавании заменить указанный модуль в шаблоне на заданный в блоке. Возможные значения: TesseractOCR; YandexVision; MicrosoftOCR; AbbyyOCR; FineReader; OCRSpace

Заменить масштаб

[Число] Задается новый масштаб при распознавании шаблоном. Если значение не задано, то используется масштаб из настроек шаблона, иначе задается указанный в этом свойстве масштаб

Атрибуты

[Словарь] Словарь с атрибутами документа. Например: "Номер документа", "ИНН поставщика" и др. В атрибуты добавляется параметр CountPage, который соответствует количеству страниц, участвующих при распознавании шаблоном

Данные

[Таблица Данных] Таблица, содержащая данные из документа

Уровень обработки

Выбор уровня обработки ошибок. Возможные значения: "Default" - по умолчанию; "Ignore" - ошибки игнорируются; "Handle" - ошибки обрабатываются. Если выбрано значение "Default", то будет использоваться значение блока "Старт" данной диаграммы

Уровень сообщений

Выбор уровня сообщений, которые будут выводить блоки при работе. Возможные значения: "Default" - по умолчанию; "Release" - вывод отключен; "Debug" - вывод основной информации; "Detailed" - вывод подробной информации. Если выбрано значение "Default", то будет использоваться значение блока "Старт" данной диаграммы

Текст ошибки

[Текст] Возвращает подробную информацию об ошибке в случае некорректного выполнения работы блока

Распознать Акт выполненных работ

Распознавание документа «Акт выполненных работ». Поддерживаемые форматы: .pdf, .png, .jpeg, .jpg.

Путь к файлу

[Текст] Путь к файлу. Поддерживаемые форматы файлов: .png;.jpg;.pdf. Файл pdf может быть многостраничным

Номер страницы

[Текст] Номер страницы в многостраничном pdf файле. Если есть якорь LastPage, то распознавание будет идти с заданного номера до страницы пока его не найдет. Если этого якоря нет, то распознается только заданная страница

Постобработка

При включении будет производиться постобработка данных. Например извлекаются ИНН, КПП

Заменить модуль

[Текст] Позволяет при распознавании заменить указанный модуль в шаблоне на заданный в блоке. Возможные значения: TesseractOCR; YandexVision; MicrosoftOCR; AbbyyOCR; FineReader; OCRSpace

Заменить масштаб

[Число] Задается новый масштаб при распознавании шаблоном. Если значение не задано, то используется масштаб из настроек шаблона, иначе задается указанный в этом свойстве масштаб

Атрибуты

[Словарь] Словарь с атрибутами документа. Например: "Номер документа", "ИНН поставщика" и др. В атрибуты добавляется параметр CountPage, который соответствует количеству страниц, участвующих при распознавании шаблоном

Данные

[Таблица Данных] Таблица, содержащая данные из документа

Уровень обработки

Выбор уровня обработки ошибок. Возможные значения: "Default" - по умолчанию; "Ignore" - ошибки игнорируются; "Handle" - ошибки обрабатываются. Если выбрано значение "Default", то будет использоваться значение блока "Старт" данной диаграммы

Уровень сообщений

Выбор уровня сообщений, которые будут выводить блоки при работе. Возможные значения: "Default" - по умолчанию; "Release" - вывод отключен; "Debug" - вывод основной информации; "Detailed" - вывод подробной информации. Если выбрано значение "Default", то будет использоваться значение блока "Старт" данной диаграммы

Текст ошибки

[Текст] Возвращает подробную информацию об ошибке в случае некорректного выполнения работы блока

Распознать Счет-фактуру

Распознавание документа «Счет-фактура». Поддерживаемые форматы: .pdf, .png, .jpeg, .jpg.

Путь к файлу

[Текст] Путь к файлу. Поддерживаемые форматы файлов: .png;.jpg;.pdf. Файл pdf может быть многостраничным

Номер страницы

[Текст] Номер страницы в многостраничном pdf файле. Если есть якорь LastPage, то распознавание будет идти с заданного номера до страницы пока его не найдет. Если этого якоря нет, то распознается только заданная страница

Постобработка

При включении будет производиться постобработка данных. Например извлекаются ИНН, КПП

Заменить модуль

[Текст] Позволяет при распознавании заменить указанный модуль в шаблоне на заданный в блоке. Возможные значения: TesseractOCR; YandexVision; MicrosoftOCR; AbbyyOCR; FineReader; OCRSpace

Заменить масштаб

[Число] Задается новый масштаб при распознавании шаблоном. Если значение не задано, то используется масштаб из настроек шаблона, иначе задается указанный в этом свойстве масштаб

Атрибуты

[Словарь] Словарь с атрибутами документа. Например: "Номер документа", "ИНН поставщика" и др. В атрибуты добавляется параметр CountPage, который соответствует количеству страниц, участвующих при распознавании шаблоном

Данные

[Таблица Данных] Таблица, содержащая данные из документа

Уровень обработки

Выбор уровня обработки ошибок. Возможные значения: "Default" - по умолчанию; "Ignore" - ошибки игнорируются; "Handle" - ошибки обрабатываются. Если выбрано значение "Default", то будет использоваться значение блока "Старт" данной диаграммы

Уровень сообщений

Выбор уровня сообщений, которые будут выводить блоки при работе. Возможные значения: "Default" - по умолчанию; "Release" - вывод отключен; "Debug" - вывод основной информации; "Detailed" - вывод подробной информации. Если выбрано значение "Default", то будет использоваться значение блока "Старт" данной диаграммы

Текст ошибки

[Текст] Возвращает подробную информацию об ошибке в случае некорректного выполнения работы блока

Распознать Счет на оплату

Распознавание документа «Счет на оплату». Поддерживаемые форматы: .pdf, .png, .jpeg, .jpg.

Путь к файлу

[Текст] Путь к файлу. Поддерживаемые форматы файлов: .png;.jpg;.pdf. Файл pdf может быть многостраничным

Номер страницы

[Текст] Номер страницы в многостраничном pdf файле. Если есть якорь LastPage, то распознавание будет идти с заданного номера до страницы пока его не найдет. Если этого якоря нет, то распознается только заданная страница

Постобработка

При включении будет производиться постобработка данных. Например извлекаются ИНН, КПП

Заменить модуль

[Текст] Позволяет при распознавании заменить указанный модуль в шаблоне на заданный в блоке. Возможные значения: TesseractOCR; YandexVision; MicrosoftOCR; AbbyyOCR; FineReader; OCRSpace

Заменить масштаб

[Число] Задается новый масштаб при распознавании шаблоном. Если значение не задано, то используется масштаб из настроек шаблона, иначе задается указанный в этом свойстве масштаб

Атрибуты

[Словарь] Словарь с атрибутами документа. Например: "Номер документа", "ИНН поставщика" и др. В атрибуты добавляется параметр CountPage, который соответствует количеству страниц, участвующих при распознавании шаблоном

Данные

[Таблица Данных] Таблица, содержащая данные из документа

Уровень обработки

Выбор уровня обработки ошибок. Возможные значения: "Default" - по умолчанию; "Ignore" - ошибки игнорируются; "Handle" - ошибки обрабатываются. Если выбрано значение "Default", то будет использоваться значение блока "Старт" данной диаграммы

Уровень сообщений

Выбор уровня сообщений, которые будут выводить блоки при работе. Возможные значения: "Default" - по умолчанию; "Release" - вывод отключен; "Debug" - вывод основной информации; "Detailed" - вывод подробной информации. Если выбрано значение "Default", то будет использоваться значение блока "Старт" данной диаграммы

Текст ошибки

[Текст] Возвращает подробную информацию об ошибке в случае некорректного выполнения работы блока

Распознать СНИЛС

Распознавание документа «СНИЛС». Поддерживаемые форматы: .pdf, .png, .jpeg, .jpg.

Путь к файлу

[Текст] Путь к файлу. Поддерживаемые форматы файлов: .png;.jpg;.pdf. Файл pdf может быть многостраничным

Номер страницы

[Текст] Номер страницы в многостраничном pdf файле. Если есть якорь LastPage, то распознавание будет идти с заданного номера до страницы пока его не найдет. Если этого якоря нет, то распознается только заданная страница

Постобработка

При включении будет производиться постобработка данных. Например извлекаются ИНН, КПП

Заменить модуль

[Текст] Позволяет при распознавании заменить указанный модуль в шаблоне на заданный в блоке. Возможные значения: TesseractOCR; YandexVision; MicrosoftOCR; AbbyyOCR; FineReader; OCRSpace

Заменить масштаб

[Число] Задается новый масштаб при распознавании шаблоном. Если значение не задано, то используется масштаб из настроек шаблона, иначе задается указанный в этом свойстве масштаб

Атрибуты

[Словарь] Словарь с атрибутами документа. Например: "Номер документа", "ИНН поставщика" и др. В атрибуты добавляется параметр CountPage, который соответствует количеству страниц, участвующих при распознавании шаблоном

Данные

[Таблица Данных] Таблица, содержащая данные из документа

Уровень обработки

Выбор уровня обработки ошибок. Возможные значения: "Default" - по умолчанию; "Ignore" - ошибки игнорируются; "Handle" - ошибки обрабатываются. Если выбрано значение "Default", то будет использоваться значение блока "Старт" данной диаграммы

Уровень сообщений

Выбор уровня сообщений, которые будут выводить блоки при работе. Возможные значения: "Default" - по умолчанию; "Release" - вывод отключен; "Debug" - вывод основной информации; "Detailed" - вывод подробной информации. Если выбрано значение "Default", то будет использоваться значение блока "Старт" данной диаграммы

Текст ошибки

[Текст] Возвращает подробную информацию об ошибке в случае некорректного выполнения работы блока

Last updated