SherpaRPA
  • База знаний
  • Содержание
  • О платформе Sherpa RPA
    • Основные понятия
    • Диаграмма развертывания Sherpa RPA
      • Последовательность шагов процесса
      • Конфигурация сети
      • Системные требования
    • Установка Sherpa RPA
      • Установка Sherpa RPA на Windows
      • Установка Sherpa RPA на Astra Linux
      • Установка Sherpa RPA на RedOS
    • Начало работы
      • Регистрация лицензии
      • Автономная активация
    • Внешний мониторинг и логирование
  • Sherpa Robot и Sherpa Assistant
    • Основные понятия
    • Установка Sherpa Robot и Sherpa Assistant
      • Установка Sherpa Robot и Sherpa Assistant на Windows
      • Установка Sherpa Unattended на ОС Astra Linux
      • Установка Sherpa Robot Unattended на RedOS
    • Работа в Sherpa Assistant
      • Главный интерфейс Sherpa Assistant
      • Действия с роботами в Sherpa Assistant
      • Контекстное меню Sherpa Assistant
        • Логи
        • Оркестратор
        • Настройки
          • Вкладка "Основное"
          • Вкладка "Регистрация"
          • Вкладка "Прокси"
            • Настройка прокси
          • Вкладка "Выполнение"
            • Настройка логирования работы роботов
          • Вкладка "Сервисы"
            • Настройка подключения к сервисам
          • Вкладка "Селекторы"
          • Вкладка "О программе"
        • Плагины
          • Установка плагинов
            • Работа с Citrix
        • Инструменты
        • Удаленная отладка
    • Sherpa Assistant: ответы на часто задаваемые вопросы
  • Sherpa Designer
    • Основные понятия
    • Установка Sherpa Designer
    • Работа в Sherpa Designer
      • Начало работы в Sherpa Designer
        • Рекомендации по созданию коммерческих сценариев
        • Горячие клавиши
      • Основное меню
        • Панель "Разработка"
          • Меню "Файл"
          • Панель "Навигация"
          • Меню "Запись"
            • Запись действий пользователя
              • Пример записи действий при работе с Калькулятором
              • Особенности записи действий пользователя в браузерах
            • Использование OCR Яндекс
          • Меню "Отладка"
            • Удаленная отладка робота
          • Меню "Дополнительно"
            • Sherpa Explorer
            • Sherpa Regex
            • Редактор окон
          • Меню "Помощь"
        • Панель "Инструменты"
      • Главная панель
        • Блоки
          • Редактор блоков
        • Проект
        • Библиотека
      • Центральная рабочая область
      • Панели свойств и переменных и работа с ними
        • Панель свойств
          • Работа с выражениями
            • Функции в выражениях
            • Методы в выражениях
          • Настройка селекторов
        • Панель "Переменные"
          • Работа с переменными
        • Примеры использования переменной и работы с выражениями
          • Простое арифметическое действие
          • Сложение числа и строки
          • Сложение двух чисел
          • Умножение текста на число
      • Нижняя центральная панель
        • Работа с логом робота
      • Руководство по веб-селекторам
        • Ручной поиск CSS-селекторов в браузере
        • Ручной поиск CSS-селекторов с помощью Sherpa Explorer
        • Как понять, что селектор не оптимальный?
        • Нотация CSS-селекторов на примерах
        • Справочник по нотации CSS- и XPath-селекторов
      • Режим «Картинка в Картинке» (PiP)
      • Примеры автоматизации популярных приложений
        • Автоматизация калькулятора
        • Точная настройка селектора в Microsoft Word
        • Автоматизация выбора шрифта в Блокноте
        • Автоматизация поиска в Яндексе
        • Извлечения данных из таблиц в Word и Excel
    • REST Клиент
    • Справочник блоков
      • Основные блоки
      • Автоматизация приложений
      • Автоматизация браузеров
      • Невидимый браузер (HTTP)
      • Автоматизация OCR
      • Оркестратор
      • SAP
      • Диалоговые окна
      • Word
      • Excel (Excel Automation)
        • Создать документ (CreateExcelDocument)
        • Открыть документ (OpenExcelDocument)
        • Подключиться к документу (ConnectExcelDocument)
        • Сохранить документ (SaveExcelDocument)
        • Закрыть документ (CloseExcelDocument)
        • Получить значение ячейки (GetExcelCellValue)
        • Записать значение в ячейку (SetExcelCellValue)
        • Загрузить Таблицу Данных (LoadDataTable)
        • Сохранить Таблицу Данных (SaveDataTable)
        • Добавить лист (AddWorksheet)
        • Удалить лист (DeleteWorksheet)
        • Переименовать лист (RenameWorksheet)
        • Переключиться на лист (ActivateWorksheet)
        • Копировать ячейки (CopyCells)
        • Получить данные из диапазона (GetExcelRange)
        • Записать данные в диапазон (SetExcelRange)
        • Очистить диапазон (ClearExcelRange)
        • Вставить данные в диапазон (InsertExcelTable)
        • Поиск текста (FindTextExcel)
        • Количество и имена листов (CountExcelWorkbook)
        • Вставить строку/колонку/ячейку (InsertExcelRange)
        • Удалить строку/колонку/ячейку (DeleteExcelRange)
        • Получить количество строк и столбцов (GetExcelCountColRow)
        • Запустить макрос (RunExcelMacro)
        • Задать цвет/стиль шрифта (SetExcelRangeColor)
        • Задать границы ячеек (SetExcelRangeBorder)
        • Задать размеры ячеек (SetExcelRangeSize)
        • Получить цвет ячейки (GetExcelCellColor)
      • Outlook (Outlook Automation)
        • Получить письма (GetOutlookMailMessages)
        • Отправить письмо (SendOutlookMailMessage)
        • Переслать письмо (ReSendOutlookMailMessage)
        • Скачать вложение (SaveAttachmentsFromOutlookMessage)
        • Сохранить письмо (SaveMailFromOutlookMessage)
        • Получить список папок (GetOutlookFolders)
        • Переместить письмо в папку (MoveOutlookMessage)
        • Извлечь e-mail отправителя из письма (ExtractEmailFromOutlookMessage)
        • Загрузить файл msg (LoadMsgFile)
        • Ответить на письмо (ReplyOutlookMailMessage)
        • Изменить свойства письма (ChangePropertiesMailFromOutlookMessage)
      • Exchange (Exchange Automation)
        • Получить письма (GetExchangeMailMessages)
        • Отправить письмо (SendExchangeMailMessage)
        • Переслать письмо (ReSendExchangeMailMessage)
        • Скачать вложение (SaveAttachmentsFromExchangeMessage)
        • Сохранить письмо (SaveMailFromExchangeMessage)
        • Переместить письмо в папку (MoveExchangeMessage)
        • Ответить на письмо (ReplyExchangeMailMessage)
      • Файловая система
        • Пример заполнения полей в Блоке “Создать папку”
      • Буфер обмена
      • Списки и словари
      • Таблицы Данных
      • Дата и время
      • Электронная почта
      • PDF
      • Текст
      • FTP/SFTP
        • Получить список папок (ListFTPFolders)
        • Получить размер файла (GetFTPfilesize)
        • Скачать папку (DownloadFTPFolder)
        • Скачать файл (DownloadFTPFile)
        • Загрузить папку (UploadFTPFolder)
        • Загрузить файл (UploadFTPFile)
        • Создать папку (CreateFTPFolder)
        • Удалить папку (RemoveFtpFolder)
        • Удалить файл (RemoveFTPfile)
        • Переименовать файл/папку (RenameFTPitem)
      • Процессы/Службы/Окна
      • Терминалы
      • Реестр
      • 1С (1C Automation)
        • Подключиться (1CCreateConnection)
        • Закрыть соединение (1CCloseConnection)
        • Выполнить запрос (1CExecuteQuery)
        • Выполнить код (1CExecuteCode)
        • Выполнить код (1CExecuteCode)
        • Извлечь данные (1CCollectData)
        • Клик мышкой по ячейке в таблице 1С (1CTableCellClick)
        • Управление CheckBox (1CCheckboxControl)
      • Базы данных
      • Google Sheets
        • Получить значение ячейки (GetGoogleSheetsCellValue)
        • Записать значение в ячейку (SetGoogleSheetsCellValue)
        • Получить значение диапазона (GetGoogleSheetsRange)
        • Записать значение в диапазон (SetGoogleSheetsRange)
      • Удаленный рабочий стол RDP/Citrix
      • Работа с архивами
      • Бизнес-функции
      • Изображения
      • Telegram
      • Учетные данные Windows и CyberArk
      • Машинное обучение
      • Анализ текстов (NLP)
    • Примеры Роботов
      • 1С Приходная накладная
      • 1С Приходная накладная (COM)
      • Actions
        • Actions. Часть 1 - Распознавание приходной накладной
        • Actions. Часть 2 - Заведение приходной накладной
      • AI Chat With Own Document
        • Create Embeddings
        • Search Embeddings
      • Calc Example
      • Calculator Action Button with Dialog
      • Calculator Action Triggers
      • Cmd Example
      • Enroll Certificates
        • Complete Enrollment
        • Create Enrollment Order
      • Find Suppliers
      • Get Auto.ru
      • Install RDP
      • Print Certificates and Badges
      • Save HeadHunter Resumes
      • Save SuperJob Jobs
      • Telegram Bot
      • Telegram client
      • Telegram Multi-User Bot
      • Telegram Multi-User Client
      • Whatsapp
      • Крестики-нолики
    • Настройка запуска Робота через Планировщик Windows
    • Перенос роботов с Windows на Linux
    • Sherpa Designer: ответы на часто задаваемые вопросы
      • Настройка входных и выходных параметров в свойствах проекта
  • Шаблонизатор Sherpa RPA
    • Интерфейс Шаблонизатора
      • Основное меню Шаблонизатора
        • Меню "Файл"
        • Меню "Обработка"
        • Кнопка "Открыть исходный файл"
        • Кнопка "Обработать документ"
        • Кнопка "Проверить"
        • Кнопка "Добавить атрибут"
        • Кнопка "Выполнить полное сканирование"
          • Результат полного сканирования
        • Кнопка "Умный помощник"
        • Переключатель "Масштаб"
        • Меню "Отображать"
      • Центральная рабочая область Шаблонизатора
      • Панель настроек Шаблонизатора
        • Настройки
        • Якоря
        • Атрибуты
        • Таблицы
        • Чертежи таблиц
    • Действия в Sherpa Designer после создания шаблона
      • Значения переменных
      • Работа с многостраничными документами
    • Примеры
      • Создание шаблона на примере документа «Справка о стоимости выполненных работ»
        • Предобработка документа
        • Создание шаблона
        • Работа с таблицами
        • Якоря
        • Создание атрибутов
      • Создание шаблона c фиксированными атрибутами на примере документа «Счет на оплату»
  • Sherpa Orchestrator
    • Основные понятия
    • Рекомендации по размещению Оркестратора
    • Резервное копирование и восстановление
    • Развертывание платформы под управлением Оркестратора
      • Установка Sherpa RPA Coordinator
        • Установка Sherpa RPA Coordinator на Windows
        • Установка Sherpa Coordinator на ОС Astra Linux
        • Установка Sherpa Coordinator на RedOS
      • Установка Sherpa RPA Runtime
    • Установка Sherpa Orchestrator
      • Установка и настройка SSL сертификатов
    • Работа в Sherpa Orchestrator
      • Начало работы в Sherpa Orchestrator
        • Настройки Оркестратора
        • Создание новой Лицензии в Оркестраторе
        • Добавление Робота в Оркестраторе
        • Принципы Работы разных типов Роботов в Оркестраторе
        • Создание Очереди в Оркестраторе
        • Создание Задачи в Оркестраторе
          • Работа с Задачами в Sherpa Designer
        • Создание нового Процесса (сценария) в Оркестраторе
          • Создание новой версии Процесса в Sherpa Designer
        • Создание Работы с выбранными Роботом и Процессом
        • Создание и настройка Триггеров в Оркестраторе
      • Шифрование
      • Параметры Пользователя
      • Рабочая область Оркестратора
      • Экраны
        • Обзор
          • NUMBER
          • BAR CHART
          • PIE CHART
          • LINE CHART
          • TIME LINE
          • TABLE
        • Роботы
        • Процессы
        • Пакеты
        • Ресурсы
        • Хранилище
        • Работы
        • Очереди
        • Действия
          • Дизайнер Формы
            • HTML
            • Label
            • Number input
            • Text input
            • Email
            • Password
            • Date
            • Time
            • Checkbox Group
            • Radio Group
            • PDF
            • Data Table
            • Image
          • Пример создания действия и его настройки
        • Триггеры
        • Сообщения Роботов
        • Аккаунты
        • Пользователи
          • Авторизация Пользователей
        • Роли
        • Папки объектов
        • Аудит
        • Лицензии
        • API
    • API
      • Робот
        • /api/robot/create
        • /api/robot/read/{guid}
        • /api/robot/update
        • /api/robot/delete/{guid}
        • /api/robot/getStatus/{guid}
        • /api/robot/setStatus
      • Группы Роботов
        • /api/robotGroup/create
        • /api/robotGroup/read/{guid}
        • /api/robotGroup/update
        • /api/robotGroup/delete/{guid}
        • /api/robotGroup/addRobot
        • /api/robotGroup/delete/{guid}
      • Процесс
        • /api/process/create
        • /api/process/read/{guid}
        • /api/process/update
        • /api/process/delete/{guid}
      • Версия процесса
        • /api/processVersion/create
        • /api/processVersion/read/{guid}
        • /api/processVersion/update
        • /api/processVersion/delete/{guid}
      • Работа
        • /api/job/create
        • /api/job/read/{guid}
        • /api/job/update
        • /api/job/delete/{guid}
      • Очередь
        • /api/queue/create
        • /api/queue/read/{guid}
        • /api/queue/update
        • /api/queue/delete/{guid}
      • Задача
        • /api/task/create
        • /api/task/read
        • /api/task/filter/read/{guid}[/{filters}]
        • /api/task/filter/list/{guid}[/{filters}]
        • /api/task/update
        • /api/task/delete
        • /api/task/addTag
        • /api/task/removeTag
      • Триггер
        • /api/schedule/create
        • /api/schedule/read/{guid}
        • /api/schedule/update
        • /api/schedule/delete/{guid}
      • Ресурс
        • /api/asset/create
        • /api/asset/read/{guid}
        • /api/asset/update
        • /api/asset/delete/{guid}
      • Хранилище
        • /api/folders/create
        • /api/folders/read/{guid}
        • /api/folders/list
        • /api/folders/update
        • /api/folders/delete/{guid}
        • /api/files/create
        • /api/files/read/{guid}
        • /api/files/update
        • /api/files/delete/{guid}
      • Лог
        • /api/log/create
        • /api/log/read/{guid}
        • /api/log/list
        • /api/log/purge
      • Аккаунт
        • /api/account/create
        • /api/account/read/{guid}
        • /api/account/update
        • /api/account/delete/{guid}
      • Пример вызова API на языке Python
    • Sherpa Orchestrator: ответы на часто задаваемые вопросы
  • Sherpa AI Server
    • Установка Sherpa AI Server
    • Авторизация пользователя в Sherpa AI Server
    • Диаграмма развертывания Sherpa AI Server в связке с Роботами
    • Работа в Sherpa AI Server
      • Главный интерфейс Sherpa AI Server
      • Чат
      • История чатов
      • Ассистенты
      • Документы
        • Работа в связке с Sherpa Designer
      • Аккаунты
      • Пользователи
        • Авторизация пользователей
      • Роли
      • Аудит
      • Лицензии
      • API
  • Sherpa Process Discovery
    • Системные требования
    • Диаграмма развертывания
      • Последовательность шагов процесса
      • Конфигурация сети
      • Механизмы аутентификации
  • Обновления
    • Обновления Sherpa Designer
      • Версия 1.33
      • Версия 1.32
      • Версия 1.31
      • Версия 1.30
      • Версия 1.29
      • Версия 1.28
      • Версия 1.27
      • Версия 1.26
      • Архив обновлений
        • Версия 1.25
        • Версия 1.24
        • Версия 1.23
        • Версия 1.22
        • Версия 1.21
        • Версия 1.20
        • Версия 1.19
        • Версия 1.15
        • Версия 1.12b
        • Добавлена поддержка Telegram
    • Обновления Sherpa Orchestrator
      • Версия 141854
      • Версия 141853
      • Версия 141852
      • Версия 141851
      • Версия 141850
      • Версия 141849
      • Версия 141848
      • Версия 141847
      • Версия 141846
      • Версия 141845
      • Версия 141844
  • Лицензии
    • Отличия Attended и Attended Floating Лицензий
    • Активация Лицензий через Sherpa Assistant
    • Управление Лицензиями Sherpa RPA через Sherpa Orchestrator
    • Лицензии Sherpa AI Server
  • Безопасность
    • Схема работы платформы Sherpa RPA c Yandex Vision через VPN
  • Обучение по разработке на Платформе Sherpa RPA
    • Обучающий курс по разработке на Платформе Sherpa RPA
  • Ссылки на дистрибутивы
    • Дистрибутивы Sherpa RPA (Windows)
    • Дистрибутивы Sherpa RPA (Linux)
  • Контакты
Powered by GitBook
On this page
  1. Sherpa Designer
  2. Работа в Sherpa Designer
  3. Примеры автоматизации популярных приложений

Автоматизация поиска в Яндексе

PreviousАвтоматизация выбора шрифта в БлокнотеNextИзвлечения данных из таблиц в Word и Excel

Last updated 1 year ago

Работа с браузерами и десктопными приложениями в Sherpa RPA максимально унифицирована.

Рассмотрим задачу ввода текста и клика в строке Яндекса. Работая с этой задачей, можно увидеть сразу несколько потенциальных проблем и научиться эти проблемы решать. При записи клика на кнопку “Найти” обратите внимание: при наведённом на кнопку курсоре цвет кнопки становится чуть темнее. Это значит, что в момент наведения курсора на кнопку у неё меняется стиль, а значит, меняется селектор. Кроме того, при попытке вписать или вставить что-то в строку поиска Яндекса, в поле редактирования работает javascript, который выполняет мгновенный поиск и мешает стандартному способу вставки текстов в поля редактирования. Чтобы решить эту проблему, воспользуемся функцией эмуляции нажатия кнопок клавиатуры.

Запишем небольшой сценарий. Нажмите на кнопку Запись. Нажмите кнопку для эмуляции нажатия клавиш клавиатуры. Появилось окошко, с помощью которого можно настроить данную функцию.

Во-первых, необходимо с помощью красного прицела указать на тот элемент управления, с которым вы хотите работать.

Обратите внимание на важный момент, который часто встречается при работе с веб-сайтами. Как только курсор переходит за границу поля редактирования, снаружи поля редактирования выделяется красной рамкой другой прямоугольник, который чуть-чуть больше поля редактирования.

Дело в том, что веб-страницы тоже состоят из множества вложенных друг в друга контейнеров, элементов и пр., и проблема с несколькими уровнями вложенности на веб—страницах выражена гораздо сильнее, чем в обычных приложениях. Из-за этого иногда вы можете кликнуть не туда и записать не то действие. Зачастую по внешнему виду сложно сказать, что из наложенных друг на друга элементов – контейнер, а что элемент управления. Нужно попробовать работать сначала с одним, и в случае ошибки с другим.

Наведите курсор на внутренний прямоугольник поля редактирования. Клик записан. Теперь введите текст для поиска.

В приведенном выше окне можно ввести любой текст, на английском или русском языке. Если для того, чтобы ввести очередной символ, нужно переключить раскладку клавиатуры, робот сделает это самостоятельно. Здесь же можно проэмулировать ввод клавиш или комбинаций клавиш.

Например, после введенного текста нужно нажать какую-то комбинацию клавиш, допустим, CTRL+Shift+S. Для этого дважды кликните по строке, где указано +CTRL (+ означает нажатие на кнопку)

Потом дважды кликните на кнопку +Shift

Это значит, что вы нажали на Shift, но Ctrl ещё не отпустили, т.е. обе клавиши нажаты вместе.

Потом просто введите с клавиатуры S.

Потом нужно отпустить нажатые клавиши. Для этого выберит пункты –Shift и –Ctrl.

Такой код, записанный в текстовом поле, позволит проэмулировать нажатие комбинации клавиш CTRL+Shift+S.

Нажмите на кнопку Тест.

В поисковой строке Яндекса вводится ваш запрос. Нажмите на кнопку Сохранить, а потом на кнопку Сохранить и закрыть на панели записи. Результат сохраняется в виде блока.

Рассмотрим свойства блока “Нажать клавиши”.

Свойство “Интерактивно” (галочка) указывает, будет ли использоваться способ ввода, при котором весь текст вставляется целиком, или после нажатия на каждую кнопку будет эмулироваться некая пауза. Часто бывает такое, что при снятой галочке скрипты, выполняющиеся на странице, мешают вводу текста. Поэтому галочку лучше проставлять, хотя без неё быстрее. Если галочка стоит, можно указать время паузы между нажатиями клавиш в миллисекундах.

Выбрать всё – довольно полезное свойство. Если проставить эту галочку, то робот перед вводом текста проэмулирует нажатие клавиш Ctrl+A, чтобы выделить весь текст, уже введенный в поле редактирования. Это полезно, если вы не уверены, что в поле, куда вы будете вводить текст, уже что-нибудь не напечатано.

Итак, после ввода нашего текста для поиска необходимо нажать кнопку Найти. Нажмём кнопку записи. Обратите внимание, при наведении мыши на кнопку Найти происходит ситуация, аналогичная описанной ранее – есть внутренняя часть кнопки, и есть внешняя часть кнопки, и они друг в друга вложены.

Запишите клик на кнопку с помощью нажатия CTRL.

Просмотрите появившийся в дизайнере блок и его селектор. Проверьте работу селектора. Селектор не работает. После ввода текста в строку поиска ничего не происходит, т.е. кнопка Найти не нажимается.

Как говорилось ранее, при наведении курсора на кнопку Найти прямоугольная область кнопки становится чуть темнее. Это значит, что на ней “висит” некий скрипт, что и меняет селектор кнопки. Это легко увидеть в окне редактирования селектора.

Хоть редактирование селекторов для браузеров осуществляется в том же окне, что и для приложений, внешний вид таких селекторов отличается. В них обычно всего две или три строки, причем верхняя строка всё так же обозначает процесс, в данном случае Chrome, а нижняя – тот селектор, с помощью которого мы будем искать нужный элемент управления страницей. Здесь используется нотация СSS-селекторов, она не такая сложная, как может показаться на первый взгляд.

Есть набор либо имён тегов (они пишутся большими буквами), либо имён классов (они пишутся маленькими буквами), и они соединены друг с другом точками. Точка здесь имеет значение “и”. Найдите элемент управления, у которого тег BUTTON, а в свойствах перечислены все те свойства, что указаны в селекторе:

В данном селекторе последняя часть вызывает сомнения:

Свойство hovered_yes означает, что над кнопкой находится курсор мыши. Оно означает, что стиль кнопки меняется из-за того, что над кнопкой находится курсор. Для корректировки этого селектора нужно просто убрать данное свойство из записи в селекторе вместе с точкой. Остальное можно оставить.

Проверьте работу селектора с помощью кнопки Подсветить.

Робот фокусирует рамку вокруг нужного элемента.

Проверьте работу селектора на практике. В дизайнере нажмите кнопку Запуск

Робот выполнил свой сценарий корректно.

Благодаря тому, что в свойствах проставлена галочка “Выбрать всё”, робот сначала удаляет текст, который уже был в элементе управления.

Итак, вы вышли на страницу результатов, и здесь следующее логичное действие – спарсить все результаты поиска, т.е. нужно получить все результаты в виде списка – прокликать все результаты и получить их описания. Это можно сделать как минимум пятью разными способами.

  1. Существуют блоки невидимого браузера, которые позволяют скачать всю страницу с результатами и извлекать из html-кода нужные результаты, Но существуют способы проще.

  2. Для работы с невидимыми браузерами есть блок Yandex—поиск, который под ключ реализует задачу поиска ключевых слов и получения результатов поиска с заданного количества страниц. Также он поддерживает автоматическое распознавание Captcha Яндекса.

  3. При визуальной работе с браузером можно использовать блок “Посчитать элементы”, с помощью которого можно посчитать, какое количество однотипных элементов находится на странице.

  4. Можно получить текст, воспользовавшись подстановочными переменными, чтобы получить определённое количество однотипных элементов со страницы. Но тогда нужно разбираться в том, как работает CSS—селектор, чтобы понять, куда правильно вставить подстановочные переменные.

  5. Ещё один простой способ – использовать кнопку Извлечь данные.

Эта кнопка позволяет извлекать структурированную информацию из веб—сайтов. Структурированная информация – списки, таблицы и просто набор похожих элементов на странице. Эта же кнопка может работать аналогичным образом не только в браузере, но и в некоторых приложениях. С её помощью можно извлечь таблицу из Excel, Word, и даже из интерфейса 1С.

Нажмите кнопку “Извлечь данные”.

Окно подсказки сообщает, что после нажатия на кнопку Далее необходимо указать один или два образца тех элементов, которые требуется извлечь. Одного образца обычно достаточно для извлечения данных из таблиц, которые были отформатированы как таблицы, и два образца предоставляются для извлечения данных из списков результатов поиска. Нажимите на кнопку Далее.

Подсветите первый результат и нажмите CTRL.

Следующее окно-подсказка рекомендует нажать Далее в этом же окне, затем подвести курсор ко ВТОРОМУ элементу данных (строке или ячейке) для его подсветки, и нажать CTRL. Последуйте данной рекомендации.

Выберите второй элемент на странице результатов. Обратите внимание, что здесь много вложенных контейнеров и при клике необходимо выбрать правильный элемент.

В окне представлены извлечённые со страницы результатов все 10 результатов поиска на основе двух отобранных нами образцов. Эти результаты можно автоматически сохранить в таблицу данных.

Если нужно извлечь из списка результатов не только заголовки, но и, допустим, описание, адреса и пр., можно использовать кнопку “Добавить новую колонку”.

При нажатии кнопки система рекомендует нажать кнопку Далее, подвести курсор мыши к образцу элемента с данными (строка или ячейка), которые нужно добавить, для подсветки рамкой данного элемента, и затем нажать CTRL.

Попробуйте извлечь доменные имена.

Появилась вторая колонка, где по нашему образцу робот собрал все результаты. Обратите внимание, что результаты из первой и второй колонки сопоставлены правильно. Т.е. робот понимает структурную связь между заголовком каждого результата и доменным именем.

Если требуется прокликать по результатам поиска и получить URL—адреса страниц, то для этого можно воспользоваться специальной функцией на вкладке редактора селектора.

Здесь представлены селекторы, по которым были извлечены первая и вторая колонки. Если что-то почему-то не срабатывает, то вы всегда можете изменить вручную данные селекторы. Кроме того, робот, как правило, предоставляет на выбор несколько разных вариантов селектора для выбора того или иного элемента:

Правильными могут быть несколько вариантов одновременно. Выбирая правильный вариант, необходимо учитывать, что в нём не должно быть изменяющихся частей. В представленных вариантах такого нет. Но если вы увидите в селекторе странное сочетание букв, символов и цифр, — это скорее всего какой-то ID, меняющийся в реальном времени. Т.е. каждый раз, когда вы будете заходить на страницу и обновлять её, данное сочетание символов будет меняться. Это значит, что робот не сможет по данному селектору в любой момент времени найти нужный элемент управления. Также сомнительным является сочетание нескольких цифр (более трёх). Это, как правило, тоже ID, а не фиксированное значение.

В данном случае селектор сработал сразу, поэтому оставляем исходное значение для обеих колонок.

Если бы вы изменили селектор, можно было бы нажать на кнопку “Обновить с использованием новых данных”. Тогда на первой вкладке вы бы увидели обновлённые результаты. Кроме того, можно перевыбрать колонку из ранее записанных или поработать со списком селектора.

Для того, что бы добавить ещё одну колонку со ссылками, необходимо нажать соответствующую кнопку.

Робот посчитал, что селектора “А” будет достаточно, и мы сможем получить ссылку на этот элемент. Нажмите на кнопку Обновить.

В результате получен новый столбец с URL-адресами страниц. Нажмите Сохранить.

В диаграмме появился предварительно настроенный блок “Извлечь данные”, в котором всё готово для извлечения результатов в реальном времени.

Как проверить работу этого блока.

Данный блок отправляет результаты в переменную, указанную в выходном свойстве результата.

Можно указать здесь любую переменную, но принято сначала объявлять переменную, с которой мы далее будем работать. Особенно если это составная переменная.

Объявите переменную Table и укажем её тип – таблицы данных.

Этого можно не делать. Если вы не создаёте переменную, но она используется как выходной параметр в каком-то свойстве, она всё равно будет создана автоматически. Удобство явного объявления переменных на панели переменных в том, что вы в режиме отладки на любом шаге сможем посмотреть текущее содержимое этой таблицы.

Выведите на экран содержимое данной таблицы. Для этого используйте блок “Окно с сообщением” из группы “Диалоговые окна”

Этот блок поддерживает вывод и простых, и сложных типов данных.

В свойствах блока выберем нашу переменную Table. Из неё будет взят текст сообщения, выводимого на экран

Вернитесь на страницу Яндекса и запустим весь сценарий.

После поиска результатов по запросу появилось окно, в котором вы видите содержимое всех трёх колонок. Данные не разделены, но тем не менее здесь записана вся извлеченная информация.

Далее можно использовать содержимое этой таблицы в циклах, в переборе по строкам – используя любые другие инструменты, которые платформа предлагает для работы с таблицами данных.