@rkfddf

Как парсить сохраняя стили (заголовки, выделения, абзацы и пр. )?

Как парсить страницу сайта сохраняя стили (заголовки, выделения, абзацы и пр. ) - то есть есть страница и собрать с неё всё, а потом перенести на другой сайт без дополнительного редактирования. И хотелось бы и картинки в нужные места сразу переносить. Переношу на wordpress, собираю через selenium python, объём большой, и можно ли упростить. Доступа к базе данных нет.
  • Вопрос задан
  • 83 просмотра
Решения вопроса 1
glaphire
@glaphire
PHP developer
В комментариях упомянули wget, оказывается действительно можно выкачать все файлы через wget (пример 9 из статьи)
https://m.habr.com/ru/company/ruvds/blog/346640/
Если это не подходит или недостаточно, то в принципе селениум же может доступаться к любому узлу DOM-дерева и может получить текст вместе с версткой (стилизацией из Wysiwyg-ов). У тегов img тоже можно получить значения атрибутов src и скачать файлы по урлу. Я не могу привести примеры кода на python, но точно знаю что это возможно и достаточно легко сделать, главное селекторы этих элементов понаходить)
Ответ написан
Комментировать
Пригласить эксперта
Ваш ответ на вопрос

Войдите, чтобы написать ответ

Войти через центр авторизации
Похожие вопросы