# Получить текст со страницы OCR

Считать текст с указанной страницы PDF-документа с использованием распознавания.

<table data-header-hidden><thead><tr><th width="210" valign="top"></th><th width="329" valign="top"></th></tr></thead><tbody><tr><td valign="top">Имя файла</td><td valign="top">[Текст] Имя pdf файла, из которого будет извлекаться текст. Можно ввести полное имя файла включающее путь.</td></tr><tr><td valign="top">Номер страницы</td><td valign="top">[Число] Номер страницы, с которой будет извлекаться текст. Нумерация начинается с 1.</td></tr><tr><td valign="top">Язык текста</td><td valign="top">Выбор языка текста.</td></tr><tr><td valign="top">Модуль</td><td valign="top">Выбор модуля OCR, применяемого при распознавании изображения в текст.</td></tr><tr><td valign="top">Метод разделения</td><td valign="top"><p>[Текст] Распознанный текст может быть автоматически разделен на участки, через запятую.</p><p>Метод разделения:</p><ul><li>0 - Использовать указанный разделитель блоков;</li><li>1 - Автоматическое разделение (только для Yandex);</li><li>2 - Разделять по пустым интервалам длиннее указанного числа символов.</li></ul></td></tr><tr><td valign="top">Разделитель блоков</td><td valign="top"><p>[Число] Шестнадцатеричный код символа, который будет считаться разделителем блоков. Например, пробел имеет код 20, знак табуляции - код 9.</p><p>Используется при выборе метода разделения 0.</p></td></tr><tr><td valign="top">Количество символов</td><td valign="top">[Число] Длина пустого пространства в распознанном тексте, измеренная в количестве символов, которая используется при выборе метода разделения текста на блоки 2.</td></tr><tr><td valign="top">Увеличение</td><td valign="top"><p>[Число] Значение, указывающее во сколько раз нужно увеличить изображение перед распознаванием.</p><p>В зависимости от используемого движка, увеличение изображения в 2 или 3 раза помогает увеличить качество распознавания.</p></td></tr><tr><td valign="top">Автоповорот страницы</td><td valign="top">При распознавании автоматически поворачивать страницу.</td></tr><tr><td valign="top">Обрабатывать аннотации</td><td valign="top">При выборе аннотации будут так же отрабатываться.</td></tr><tr><td valign="top">Результат</td><td valign="top">[Текст] Возвращается извлеченный со страницы текст.</td></tr><tr><td valign="top">Уровень обработки</td><td valign="top"><p>Выбор уровня обработки ошибок. Возможные значения:</p><ul><li>"Default" - по умолчанию;</li><li>"Ignore" - ошибки игнорируются;</li><li>"Handle" - ошибки обрабатываются.</li></ul><p>Если выбрано значение "Default", то будет использоваться значение блока "Старт" данной диаграммы.</p></td></tr><tr><td valign="top">Уровень сообщений</td><td valign="top"><p>Выбор уровня сообщений, который будут выводить блоки при работе. Возможные значения:</p><ul><li>"Default" - по умолчанию;</li><li>"Release" - вывод отключен;</li><li>"Debug" - вывод основной информации;</li><li>"Detailed" - вывод подробной информации.</li></ul><p>Если выбрано значение "Default", то будет использоваться значение блока "Старт" данной диаграммы.</p></td></tr><tr><td valign="top">Текст ошибки</td><td valign="top">[Текст] Возвращает подробную информацию об ошибке в случае некорректного выполнения работы блока.</td></tr></tbody></table>


---

# Agent Instructions: Querying This Documentation

If you need additional information that is not directly available in this page, you can query the documentation dynamically by asking a question.

Perform an HTTP GET request on the current page URL with the `ask` query parameter:

```
GET https://docs.sherparpa.ru/sherpa-rpa/sherpa-designer/spravochnik-blokov/pdf-pdf-automation/poluchit-tekst-so-stranicy-ocr-getpagetextocr.md?ask=<question>
```

The question should be specific, self-contained, and written in natural language.
The response will contain a direct answer to the question and relevant excerpts and sources from the documentation.

Use this mechanism when the answer is not explicitly present in the current page, you need clarification or additional context, or you want to retrieve related documentation sections.
