Таблицы

На рабочей панели справа отображаются все таблицы шаблона, которые были распознаны ранее. Их может быть неограниченное количество. Каждой таблице автоматически присваивается номер, нумерация начинается с 0. Также, отображается количество колонок каждой распознанной таблицы. Именно по этому значению можно определить с какой (или с какими) таблицами продолжить работу.

Основные инструменты для работы с таблицами:

№ п/п

Инструмент

Описание

1.

кнопка

Позволяет добавить новую таблицу.

2.

кнопка

Позволяет копировать выделенную таблицу.

3.

Позволяет удалить выделенную таблицу.

4.

Позволяет привязать якорь к выбранному свойству.

5.

Позволяет удалить якорь из выбранного свойства.

6.

Позволяет добавить колонку таблицы.

7.

Позволяет удалить колонку таблицы.

8.

Импортировать все таблицы из документа.

Свойства таблиц

На рабочей панели открывается список свойств и инструментов для работы с таблицей.

Свойства и инструменты для работы с таблицами:

№ п/п

Свойство/инструмент

Описание

1.

Индекс

Индекс OCR таблицы. Для улучшения привязки рекомендуется указывать минимальное количество колонок. В случае, если Шаблонизатор извлекает данные лишь из одной таблицы сканированного документа, необходимо указывать индекс, равный 0.

2.

Пропустить строки

При необходимости возможно указать количество первых строк, которые нужно пропустить для того, чтобы данные этих строк не попали в результаты работы робота. При выборе значения, равного 1, — первая строка будет пропущена. Наименования колонок будут соответствовать значениям первой строки. Если задать названия колонок в шаблоне, то эти значения не будут изменены.

3.

Строк в заголовке

При построении таблицы заданное количество строк будет использовано для создания заголовков колонок. При указании значения 0, названия будут взяты из шаблона колонок, в противном случае название будет суммироваться из ячеек колонки по заданному количеству строк. Например, если в заголовок должна попасть информация, размещенная в двух верхних строках таблицы, — необходимо указать количество строк в заголовке, равное 2.

4.

Связующий якорь

При работе с документом, в котором есть несколько таблиц можно указать связующий якорь, имеющий тип Optional. Якорь укажет на какие-либо слово, заголовок, пункт, после которых начинается нужная таблица. При нахождении такого якоря таблица, следующая за ним, будет распознаваться.

5.

Финишный якорь

Финишный якорь ограничивает извлечение таблицы до якоря, который может иметь тип Optional. Таким якорем, например, может служить строка в таблице “Всего к оплате”. Таблица будет извлечена из документа до финишного якоря.

6.

Верхний ограничивающий якорь

Якорь, после которого таблица начнет строиться.

7.

Нижний ограничивающий якорь

Якорь до которого таблица будет строиться.

8.

Минимальное количество колонок

Минимальное количество колонок в OCR таблице. Все таблицы с количеством колонок меньше указанного пропускаются.

9.

Максимальное количество колонок

Максимальное количество колонок в OCR таблице. Все таблицы с количеством больше указанного пропускаются.

10.

Точное равенство колонок

При включенной настройке извлекаться будут только те таблицы, у которых количество колонок в документе меньше или равно заданному в шаблоне.

11.

Колонки на первой странице

При включенной настройке колонки будут браться только с первой страницы. Данная настройка указывает на то, что на следующих страницах у таблицы нет заголовков.

12.

Склеивать таблицы

При включенной настройке таблицы с одинаковым количеством колонок будут склеиваться. Если настройка не включена, такие таблицы будут добавляться как новые.

13.

Ошибка если таблица пустая

При обработке шаблона, если таблица пустая, то будет сгенерирована ошибка распознавания.

14.

Колонки

Колонки таблицы. По каждой таблице отображается соответствующее ей количество колонок. Также, здесь будут указываться:

  • Индекс (задается автоматически);

  • Имя (задается пользователем);

  • Тип данных (Text – текст; Int – число; Float – вещественное число; Date Time – дата и время; Chars – только буквы (исключаются цифры и другие символы)).

В случае, если в результатах полного сканирования отсутствует несколько колонок, то мы можем их добавить.

Last updated