Якоря
Якоря — точки на сканированном документе, с помощью которых робот определяет, в какой части документа размещаются определенные данные.
При помощи якорей мы задаем границы определенных атрибутов. Якорей может быть сколь угодно много, в зависимости от типа документа.
Инструменты для работы с якорями
При создании нового якоря на рабочей панели открывается список свойств и инструментов для работы с якорем.
Основные инструменты для работы с якорями:
Новый якорь | Добавляет новый якорь |
Копировать якорь | Копирует выделенный якорь и автоматически добавляет новый якорь вместе с заданными настройками |
Удалить якорь | Удаляет выделенный якорь |
Добавить привязку | Добавляет новую привязку к выделенному якорю |
Удалить привязку | Удаляет выделенную привязку |
Переместить привязку вверх | Перемещает привязку вверх |
Переместить привязку вниз | Перемещает привязку вниз |
Настройки якоря
Для работы с якорями предусмотрены следующие параметры:
ID | Идентификатор якоря. Присваивается автоматически. |
Якорные привязки | Список якорных привязок. Для добавления новой привязки необходимо кликнуть на значение якорные привязки, затем кликнуть клавишей мыши на ранее созданный якорь на документе. Именно к этому якорю будет осуществляться привязка. |
Тип | Выбирается из выпадающего списка: 1.Text – текст 2.Table – таблица или ячейка таблицы 3.Packet – пакет взаимозаменяемых якорей (при привязке к этому якорю будут взяты его подчиненные якоря, первый успешно найденный из списка) |
Значение | Для якоря типа Text возможно указывать подстановочные знаки (*)(?) Для якоря типа Table значение записывается в формате «Индекс таблицы:Индекс строки:Индекс колонки». Например, для Text «*обл* страх*» (два слова при включении «Раздельные слова»), для Table – «0:1:2» (таблица 0, строка 1, колонка 2), «1:2» (таблица 1, строка 2), «2» (вся таблица 2) |
Режим работы | Режим работы якоря. Возможные значения: 1.Default – якорь обязателен на первой странице многостраничного документа 2.LastPage – якорь будет обязателен в многостраничном документе и укажет на последнюю страницу 3.Optional – необязательный якорь и если он не будет найден на странице, то ошибка не сгенерируется |
Раздельные слова | При включенной настройке значение якоря разбивается на слова и каждое слово ищется отдельно True (правда) – выключено False (ложь) — выключено |
Количество блоков | Если выбрано свойство «Раздельные слова», то при поиске якоря возможна ситуация, когда в заданной области могут быть найдены несколько значений блоков, соответствующие заданным словам. Данное свойство позволяет ограничить максимальное количество слов между блоками |
Описание | Пользовательское описание |
Рабочие данные | Данные, вычисляемы в результате работы, используются только для справочной информации. |
Подчиненные якоря | Якоря, напрямую зависящие от родительского якоря. Поиск подчиненных якорей будет происходит только после того, как будет найден главный/родительский якорь. В случае, если в настройках родительского якоря указан режим «Optional» (т.е. он не является обязательным), и если родительский якорь не был найден, то и поиск подчиненных якорей не будет осуществлен, они будут пропускаться. Эта опция используется, если атрибут находится в середине многостраничного документа. |
Создание якоря
Для того, чтобы Шаблонизатор мог корректно определить местоположение атрибута в документе, необходимо ограничить его границы. Ограничение верхней границы задается по тексту, находящемуся на строку выше самого атрибута.
Для присвоения значения якорю достаточно кликнуть левой клавишей мыши по OCR-блоку (слову), которое мы выбрали в качестве якоря. Также можно указать значение вручную, написав якорное слово в строке Значение.
Когда значение якоря задается нажатием клавишей мыши на OCR-блок, — к значению автоматически добавляется знак «*», если значение указывается вручную, — вы также можете добавить этот знак. В некоторых документах встречаются слова с невидимыми символами (Unicode) или в конце слова может быть добавлен какой-либо другой символ (№, (, / и т.д.), который не позволит распознать заданный якорь. В таких случаях рекомендуем добавлять знак «*» по аналогии с Wildcard.
При использовании якорных привязок знак «*» нужно удалить и после этого добавить привязку.
В случае, если значение содержит два и более слова, — между ними необходимо ставить пробел, т.к. он выступает разделителем слов.
Шаблонизатор позволяет задать для якоря несколько альтернативных вариантов, по которым робот будет распознавать завершающий атрибут.
В строке «Значение» нажать на кнопку выпадающего окна, в котором достаточно прописать альтернативные варианты. Слово подпис*, указано без окончания, т.к. в документе может быть указано как подпись, там и подписи.
Проверяем корректность расположения якорей.
При создании якорей, в значении которых содержится несколько слов, необходимо указывать знак «*» в конце каждого слова, а между словами ставить пробел.
Если сочетание слов встречается в документе единожды, то второе слово можно написать сокращенно. Например, в качестве якоря по номеру документа можем указать «номер* докум*»
Если в начале значения якоря присутствует лишний символ (чаще всего это скобка), мы можем удалить этот символ и вместо него поставить знак «*». Тогда получим значение *организация* вместо (организация*.
При создании шаблона необходимо указать якорь, который будет завершать документ. Т.е. по этому якорю мы можем определить, что в документе таблиц больше нет и работу с таблицами можно завершать.
Завершающий якорь
При создании шаблона необходимо указать якорь, который будет завершать документ. Т.е. по этому якорю мы можем определить, что в документе таблиц больше нет и работу с таблицами можно завершать.
Для завершающего якоря указываем Режим работы – LastPage.
Например, завершающим якорем может быть слово расшифровка*, т.к. чаще всего это слово указывается на последней странице документа.
Шаблонизатор позволяет задать для якоря несколько альтернативных вариантов, по которым робот будет распознавать завершающий атрибут.
Добавим слово подпис*, укажем намеренно без окончания, т.к. в документе может быть указано как подпись, там и подписи.
Если в документе отсутствует слово расшифровка*, то робот будет искать слово подпис*.
Якорные привязки
Основные инструменты для работы с якорными привязками:
ID якоря | ID якоря, к которому происходит привязка |
Параметр | Параметр привязки. Возможные значения: 1.TopLeft – привязка левого верхнего угла якоря к выбранному объекту привязки 2.TopRight – привязка правого верхнего угла якоря к выбранному объекту привязки 3.BottomLeft – привязка левого нижнего угла якоря к выбранному объекту привязки 4.BottomRight – привязка правого нижнего угла якоря к выбранному объекту привязки 5.Left – привязка левой грани якоря (посередине) к выбранному объекту привязки 6.Top – привязка верхней грани якоря (посередине) к выбранному объекту привязки 7.Right – привязка правой грани якоря (посередине) к выбранному объекту привязки 8.Bottom – привязка верхней грани якоря (посередине) к выбранному объекту привязки 9.LeftArea – привязка всей левой области якоря к выбранному объекту привязки 10.RightArea – привязка всей правой области якоря к выбранному объекту привязки 11.BottomArea – привязка всей нижней области якоря к выбранному объекту привязки 12.TopArea — привязка всей верхней области якоря к выбранному объекту привязки 13.FullArea – привязка якоря со всех сторон к выбранному объекту привязки |
Объект привязки | Указывается точка или грань области атрибута для привязки выбранного параметра |
Принудительно | При включении указанный параметр якоря будет задан к выбранному объекту привязки принудительно и без проверок |
Смещение Х | Смещение по оси Х. Значение указывается в пикселах в формате +- для точного смещения. Например, +10-20 |
Смещение У | Смещение по оси Y. Укажите значение +- для точного смещения. Например, +10-20 |
Для создания привязок в созданном атрибуте нажимаем «Якорные привязки», далее «Добавить привязку», затем левой клавишей мыши кликаем на якорное слово (OCR-блок).
Для корректного распознавания области документа, данные из которой будут импортироваться в результаты, для атрибутов необходимо осуществить привязку к ранее созданным якорям.
Привязка может осуществляться не только к атрибутам, находящимся справа и слева, но и к атрибутам сверху или снизу. Для определения нахождения нужной нам области данных необходимо воспользоваться Параметрами якорной привязки и выбрать из выпадающего списка подходящий параметр.
Например, чтобы ограничить область данных атрибута сверху, создаем якорную привязку к OCR-блоку. Нажимаем Добавить привязку, кликаем левой клавишей мыши на созданный ранее якорь. В параметрах привязки выбираем значение Bottom, т.к. в качестве ориентира мы будем использовать нижнюю границу данного якоря.
Помимо параметра в привязке для данного атрибута необходимо указать Объект привязки. Т.к. данные атрибута могут располагаться выше строки, которую мы выделили при помощи первых двух якорей слева и справа.
В строке Объект привязки указываем TopEdge — верхняя грань.
После проверки в шаблоне каждый атрибут будет отображаться в виде синей рамки. В случае, если границы рамки не захватывают всю область данных атрибута, необходимо внести изменения в настройки.
Рамка атрибута не всегда имеет ровную форму, правый верхний угол может быть выше левого верхнего угла, — это некритично. Главное, чтобы данные атрибута полностью помещались в созданную рамку.
Last updated