Как парсить сохраняя стили (заголовки, выделения, абзацы и пр. )?

Question

rkfddf @rkfddf

Как парсить сохраняя стили (заголовки, выделения, абзацы и пр. )?

Как парсить страницу сайта сохраняя стили (заголовки, выделения, абзацы и пр. ) - то есть есть страница и собрать с неё всё, а потом перенести на другой сайт без дополнительного редактирования. И хотелось бы и картинки в нужные места сразу переносить. Переношу на wordpress, собираю через selenium python, объём большой, и можно ли упростить. Доступа к базе данных нет.

Вопрос задан более трёх лет назад
89 просмотров

1 комментарий

Подписаться 1 Средний 1 комментарий

Помогут разобраться в теме Все курсы

Нетология

Fullstack-разработчик на Python + нейросети

20 месяцев

Далее
Skillfactory

Профессия Python-разработчик

9 месяцев

Далее
Яндекс Практикум

Python-разработчик

10 месяцев

Далее

Решения вопроса 1

Комментировать

Пригласить эксперта

Ваш ответ на вопрос

Войдите, чтобы написать ответ

Похожие вопросы

Python

Простой
Каким образом я могу запускать привязанных ботов в основном, что-бы основной loop не ломался и не дублировался?
- 1 подписчик
- 15 нояб.
- 151 просмотр
0

ответов
Python

Простой
Почему конвертация .py файла в .exe с помощью auto-py-to-exe происходит аномально долго и как это исправить?
- 1 подписчик
- 08 нояб.
- 213 просмотров
0

ответов
Python

+2 ещё

Простой
Как решить ошибку с отправкой почты через Outlook SMTP?
- 1 подписчик
- 08 нояб.
- 146 просмотров
0

ответов
Python

+2 ещё

Средний
Как конвертировать drawio (xml) в xml zabbix map?
- 2 подписчика
- 08 нояб.
- 112 просмотров
1

ответ
Python

Простой
Какой браузер с headless для python не распознаеться и не блокируеться google ai studio?
- 2 подписчика
- 31 окт.
- 250 просмотров
0

ответов
Python

Простой
Как сформировать изображение GS1 DataMatrix с функциональными знаками?
- 1 подписчик
- 31 окт.
- 135 просмотров
0

ответов
Python

+1 ещё

Простой
Почему callback_query_handler в telebot не работает?
- 1 подписчик
- 31 окт.
- 140 просмотров
3

ответа
Python

+1 ещё

Простой
Как исправить проблему с Docling?
- 1 подписчик
- 28 окт.
- 141 просмотр
0

ответов
Python

Простой
Что делать если turtle в python не отвечает?
- 1 подписчик
- 22 окт.
- 259 просмотров
2

ответа
Python

Простой
Не могу разобраться почему не работает код python?
- 1 подписчик
- 22 окт.
- 426 просмотров
1

ответ
Показать ещё Загружается…

Backend developer (Python, FastAPI)

BCraft

До 4 000 $

Backend Python Developer Middle/Senior

AppRoute

До 3 000 $

Python back-end engineer (+Kotlin)

YoloPrice

от 360 000 до 420 000 ₽

Как парсить сохраняя стили (заголовки, выделения, абзацы и пр. )?

Это будет не парсер, а загрузчик. wget'ом тогда.

Answer 1 · 2021-01-19 23:29:47

В комментариях упомянули wget, оказывается действительно можно выкачать все файлы через wget (пример 9 из статьи)
https://m.habr.com/ru/company/ruvds/blog/346640/
Если это не подходит или недостаточно, то в принципе селениум же может доступаться к любому узлу DOM-дерева и может получить текст вместе с версткой (стилизацией из Wysiwyg-ов). У тегов img тоже можно получить значения атрибутов src и скачать файлы по урлу. Я не могу привести примеры кода на python, но точно знаю что это возможно и достаточно легко сделать, главное селекторы этих элементов понаходить)

Как парсить сохраняя стили (заголовки, выделения, абзацы и пр. )?

Войдите, чтобы написать ответ

Минуточку внимания

Войдите на сайт