Как сделать парсер статей?

Question

Узаир Ижа @UZEIR

Учусь. Пытаюсь развиваться.

PHP

Как сделать парсер статей?

Есть ли примеры? Какие не будь наводки или алгоритм действия. Хочу научится не знаю с чего начать.
Парсер с сайта на сайт

Вопрос задан более трёх лет назад
275 просмотров

Комментировать

Подписаться 2 Оценить Комментировать

Помогут разобраться в теме Все курсы

Skillfactory

Профессия Fullstack веб-разработчик на JavaScript и PHP

20 месяцев

Далее
Хекслет

PHP-разработчик

10 месяцев

Далее
Нетология

Веб-разработчик с нуля: профессия с выбором специализации

14 месяцев

Далее

Пригласить эксперта

Ответы на вопрос 2

1 комментарий

3 комментария

Ваш ответ на вопрос

Войдите, чтобы написать ответ

Похожие вопросы

PHP

+2 ещё

Простой
Как реализовать зеркало сайт Тильда?
- 1 подписчик
- 22 окт.
- 192 просмотра
0

ответов
PHP

+1 ещё

Простой
Почему перестала работать ЮКасса?
- 1 подписчик
- 19 окт.
- 269 просмотров
1

ответ
PHP

Простой
Как вычислить результат математических операций в строке?
- 1 подписчик
- 17 окт.
- 256 просмотров
3

ответа
PHP

Простой
Можно ли в PHP вкладывать однострочные комментарии // в многострочные /* */?
- 1 подписчик
- 16 окт.
- 243 просмотра
4

ответа
PHP

+1 ещё

Простой
Перестал работать php запрос к телеграмм?
- 1 подписчик
- 15 окт.
- 240 просмотров
1

ответ
PHP

+2 ещё

Простой
Как проще отправить изображение на стену канала?
- 1 подписчик
- 15 окт.
- 158 просмотров
1

ответ
PHP

Простой
Как точно работает скрипт на RoadRunner?
- 1 подписчик
- 13 окт.
- 221 просмотр
1

ответ
PHP

+1 ещё

Простой
Стоит ли использовать файловый сервер в проекте?
- 2 подписчика
- 13 окт.
- 261 просмотр
3

ответа
PHP

+1 ещё

Средний
Почему некорректно работает регулярное выражение в PHP?
- 1 подписчик
- 06 окт.
- 271 просмотр
3

ответа
PHP

+1 ещё

Средний
Что входит в отладку скрипта на PHP?
- 1 подписчик
- 02 окт.
- 266 просмотров
1

ответ
Показать ещё Загружается…

PHP-разработчик

Остров Сокровищ

от 180 000 до 250 000 ₽

PHP-разработчик (Symfony)

Мегаплан

от 160 000 ₽

Разработчик PHP/Go

ЭТП ГПБ / VESNA

До 220 000 ₽

Answer 1 · 2015-11-05 15:16:37

Beltoev верно все написал. Для реализации можно воспользоваться всякими готовыми библиотеками, например simplehtmldom.sourceforge.net

Answer 2 · 2015-11-05 15:06:08

А что именно вызывает сложности?

Тут как бы алгоритм банальный:

Берем список адресов всех нужных нам статей и проходимся по нему
Получаем содержимое страницы (file_get_contents можно использовать)
Определяем, какие данные нам интересны (например, всё, что внутри блока <div class="content">...</div>)
Получаем эти данные какой-нибудь регуляркой и пишем себе в БД
Профит

Это пример самого простого парсера.

Дальше можно наращивать функционал (автоматическое определение новых статей на сайте по cron-у, загрузка изображений на свой сервер и замена ссылок на них в статьях, либо подмена ссылок на изображения посредством .htaccess и т. д. и т. п.)

Уверен, есть готовые библиотеки для этого, но и самому это сделать не так уж и сложно

Как сделать парсер статей?

Войдите, чтобы написать ответ

Минуточку внимания

Войдите на сайт