Задать вопрос

Парсинг сайта (его содержимого) из веб-архива. Как?

Всем доброго времени суток!

Собственно, вопрос непосредственно в заголовке. Как сегодня лучше всего вытянуть содержимое (или сам сайт) из веб-архива?
Быть может есть у кого-то опыт, поделитесь плюшками.

Заранее спасибо.

ps. быть может есть какая-то библеотека python для этого дела. Это было бы ещё лучше.
  • Вопрос задан
  • 926 просмотров
Подписаться 3 Простой 3 комментария
Помогут разобраться в теме Все курсы
  • Нетология
    Веб-разработчик с нуля: профессия с выбором специализации
    14 месяцев
    Далее
  • Skillfactory
    Профессия Веб-разработчик
    12 месяцев
    Далее
  • Академия Eduson
    FullStack-разработчик: тариф PRO
    14 месяцев
    Далее
Пригласить эксперта
Ответы на вопрос 2
weranda
@weranda
Wayback Machine Downloader называется штуковина — это если все скопировать, а если парсить, т. е. разбирать на части, то тут масса вариантов, к примеру lxml (вроде его используют внутри BeautifulSoup и Scrapy).
Ответ написан
Комментировать
@hurgadan
как вариант https://github.com/puppeteer/puppeteer, для парсинга сайта. Правда не знаю что вы имеете в виду под "веб-архивом"
Ответ написан
Ваш ответ на вопрос

Войдите, чтобы написать ответ

Похожие вопросы