Sc0undRel
@Sc0undRel

Как спарсить все ссылки с чужого сайта?

Мне необходимо спарсить с чужого сайта все текстовые внешние ссылки.

То есть надо запустить некий процесс, который обойдёт все страницы сайта, и выпишет все найденные внешние некликабельные ссылки.

Результат желательно в виде
урл страницы сайта, где была найдена ссылка -> найденная ссылка

Подскажите, пожалуйста, есть ли готовые программы для этого или какие еще варианты это сделать?
  • Вопрос задан
  • 6454 просмотра
Пригласить эксперта
Ответы на вопрос 3
Возможно, это подойдёт: www.scripts.morshed-alam.com/url-scraper-php
Ответ написан
Комментировать
e_svirsky
@e_svirsky
Web Developer
Если есть навыки программирования то Symfony-вский crawler легко справится с этой задачей. Простенький скрипт будет.
Ответ написан
Комментировать
@f9k56
Сделал бы так. Wget-том вытащил сайт на локалку, потом обработал Content Downloader.
Ответ написан
Комментировать
Ваш ответ на вопрос

Войдите, чтобы написать ответ

Войти через центр авторизации
Похожие вопросы