Задать вопрос

Парсинг сайта (его содержимого) из веб-архива. Как?

Всем доброго времени суток!

Собственно, вопрос непосредственно в заголовке. Как сегодня лучше всего вытянуть содержимое (или сам сайт) из веб-архива?
Быть может есть у кого-то опыт, поделитесь плюшками.

Заранее спасибо.

ps. быть может есть какая-то библеотека python для этого дела. Это было бы ещё лучше.
  • Вопрос задан
  • 793 просмотра
Подписаться 3 Простой 3 комментария
Пригласить эксперта
Ответы на вопрос 2
weranda
@weranda
Wayback Machine Downloader называется штуковина — это если все скопировать, а если парсить, т. е. разбирать на части, то тут масса вариантов, к примеру lxml (вроде его используют внутри BeautifulSoup и Scrapy).
Ответ написан
Комментировать
@hurgadan
как вариант https://github.com/puppeteer/puppeteer, для парсинга сайта. Правда не знаю что вы имеете в виду под "веб-архивом"
Ответ написан
Ваш ответ на вопрос

Войдите, чтобы написать ответ

Похожие вопросы
22 дек. 2024, в 20:40
10000 руб./за проект
22 дек. 2024, в 20:34
3000 руб./за проект
22 дек. 2024, в 20:12
10000 руб./за проект