Обучение Парсингу и Работе с Selenium
Добро пожаловать на страницу для практики парсинга HTML и автоматизации с Selenium. Здесь много элементов для тестов.
Введение в Парсинг
Парсинг — это процесс извлечения данных из HTML. Используйте BeautifulSoup или Selenium для навигации по DOM.
Этот div имеет уникальный ID и класс.
Много текста для поиска: Lorem ipsum dolor sit amet, consectetur adipiscing elit. Sed do eiusmod tempor incididunt ut labore et dolore magna aliqua.
Скрытый параграф для тестов visibility.
Формы для Практики
Таблицы для Парсинга
| ID | Имя | Возраст | Страна |
|---|---|---|---|
| 1 | Иван | 25 | Россия |
| 2 | Мария | 30 | США |
| 3 | Ли | 28 | Китай |
| 4 | Анна | 22 | Германия |
| 5 | Джон | 35 | Великобритания |
Списки
- Элемент 1 с классом
- Элемент 2
- Специальный элемент
- Элемент 4
- Элемент 5 с длинным текстом: Ut enim ad minim veniam, quis nostrud exercitation ullamco laboris nisi ut aliquip ex ea commodo consequat.
- Шаг 1
- Шаг 2
- Шаг 3
- Шаг 4
- Шаг 5
Примеры Кода
from bs4 import BeautifulSoup
soup = BeautifulSoup(html, 'html.parser')
print(soup.find('h1').text)
from selenium import webdriver
driver = webdriver.Chrome()
driver.get('url')
element = driver.find_element_by_id('id')
Много примеров для копирования и парсинга.
Изображения
Изображения с плейсхолдерами для тестов src и alt.
Ссылки
parsertools.ru Внутренняя ссылка Python SeleniumМного ссылок для извлечения href.
