Задать вопрос
UZEIR
@UZEIR
Учусь. Пытаюсь развиваться.

Как сделать парсер статей?

Есть ли примеры? Какие не будь наводки или алгоритм действия. Хочу научится не знаю с чего начать.
Парсер с сайта на сайт
  • Вопрос задан
  • 275 просмотров
Подписаться 2 Оценить Комментировать
Помогут разобраться в теме Все курсы
  • Skillfactory
    Профессия Fullstack веб-разработчик на JavaScript и PHP
    20 месяцев
    Далее
  • Хекслет
    PHP-разработчик
    10 месяцев
    Далее
  • Нетология
    Веб-разработчик с нуля: профессия с выбором специализации
    14 месяцев
    Далее
Пригласить эксперта
Ответы на вопрос 2
Beltoev верно все написал. Для реализации можно воспользоваться всякими готовыми библиотеками, например simplehtmldom.sourceforge.net
Ответ написан
@Beltoev
Живу в своё удовольствие
А что именно вызывает сложности?

Тут как бы алгоритм банальный:
  1. Берем список адресов всех нужных нам статей и проходимся по нему
  2. Получаем содержимое страницы (file_get_contents можно использовать)
  3. Определяем, какие данные нам интересны (например, всё, что внутри блока <div class="content">...</div>)
  4. Получаем эти данные какой-нибудь регуляркой и пишем себе в БД
  5. Профит


Это пример самого простого парсера.

Дальше можно наращивать функционал (автоматическое определение новых статей на сайте по cron-у, загрузка изображений на свой сервер и замена ссылок на них в статьях, либо подмена ссылок на изображения посредством .htaccess и т. д. и т. п.)

Уверен, есть готовые библиотеки для этого, но и самому это сделать не так уж и сложно
Ответ написан
Ваш ответ на вопрос

Войдите, чтобы написать ответ

Похожие вопросы