@yohiromoro

Как получить весь текст сайта (со всех вкладок и т.д.)?

Поступил заказ на перевод сайта, но для этого нужен ВЕСЬ текст. Как это сделать? Есть ли программа? В идеале чтобы каждая новая страница сайта сохранилась в отдельном доке. Или только платные парсеры?
  • Вопрос задан
  • 161 просмотр
Решения вопроса 1
В зависимости от сложности задачи, желания ковыряться, и умения в окружающие технологии, можно предложить кучу вариантов, от банальных менеджеров закачек, типа wget:

wget -r -k -l 7 -p -E -nc http://site.com/

до тяжелых и умеющих всякое библиотек и целых фреймворков типа scrapy

Гуглить по словам «web crawler»
Ответ написан
Комментировать
Пригласить эксперта
Ваш ответ на вопрос

Войдите, чтобы написать ответ

Войти через центр авторизации
Похожие вопросы