Как парсить сохраняя стили (заголовки, выделения, абзацы и пр. )?
Как парсить страницу сайта сохраняя стили (заголовки, выделения, абзацы и пр. ) - то есть есть страница и собрать с неё всё, а потом перенести на другой сайт без дополнительного редактирования. И хотелось бы и картинки в нужные места сразу переносить. Переношу на wordpress, собираю через selenium python, объём большой, и можно ли упростить. Доступа к базе данных нет.
В комментариях упомянули wget, оказывается действительно можно выкачать все файлы через wget (пример 9 из статьи) https://m.habr.com/ru/company/ruvds/blog/346640/
Если это не подходит или недостаточно, то в принципе селениум же может доступаться к любому узлу DOM-дерева и может получить текст вместе с версткой (стилизацией из Wysiwyg-ов). У тегов img тоже можно получить значения атрибутов src и скачать файлы по урлу. Я не могу привести примеры кода на python, но точно знаю что это возможно и достаточно легко сделать, главное селекторы этих элементов понаходить)