Задать вопрос

Bjornie @Bjornie

Изучаю Python

php

Использовать phantomjs или пройтись циклом по миллиону страниц?

Хочу сохранить данные с сайта, в котором присутствует элементы, у которых нет прямого адреса в атрибутах, например пейджеры, кнопка "Подробнее" (попап). Просто cURL и htmlsimpledomparser будет не достаточно для имитации клика.

При этом я знаю адреса конечных страниц, которые выглядит подобным образом /index.php?id=1362

Идея пройтись в цикле по порядку от 1 до 1.000.000 (cURL), при этом на дальнейший разбор (parser) отправлять только страницы, у которых есть валидный html-title (к сожалению все страницы отдают код 200, и невозможно их отличить по-другому).

Как считаете хороша ли такая идея, чтобы не мудрить с phantomjs, и пройтись танком по миллиону страниц?

Скрипт буду запускать с десктопа из консоли.

Вопрос задан более трёх лет назад
300 просмотров

Комментировать

Подписаться 1 Оценить Комментировать

Помогут разобраться в теме Все курсы

Skillfactory

Профессия Fullstack веб-разработчик на JavaScript и PHP

20 месяцев

Далее
Хекслет

PHP-разработчик

10 месяцев

Далее
Skillbox

PHP-разработчик. Базовый уровень

3 месяца

Далее

Пригласить эксперта

Ответы на вопрос 1

_ _ @AMar4enko

Ну если вас на десятом запросе не забанят - то почему бы нет?

Ответ написан более трёх лет назад

1 комментарий

1 комментарий

Ваш ответ на вопрос

Войдите, чтобы написать ответ

Похожие вопросы

PHP

+2 ещё

Простой
Как реализовать зеркало сайт Тильда?
- 1 подписчик
- 4 часа назад
- 68 просмотров
0

ответов
PHP

+1 ещё

Простой
Почему перестала работать ЮКасса?
- 1 подписчик
- 19 окт.
- 241 просмотр
1

ответ
PHP

Простой
Как вычислить результат математических операций в строке?
- 1 подписчик
- 17 окт.
- 237 просмотров
3

ответа
PHP

Простой
Можно ли в PHP вкладывать однострочные комментарии // в многострочные /* */?
- 1 подписчик
- 16 окт.
- 219 просмотров
4

ответа
PHP

+1 ещё

Простой
Перестал работать php запрос к телеграмм?
- 1 подписчик
- 15 окт.
- 227 просмотров
1

ответ
PHP

+2 ещё

Простой
Как проще отправить изображение на стену канала?
- 1 подписчик
- 15 окт.
- 146 просмотров
1

ответ
Python

+1 ещё

Сложный
Как автоматизировать работу с сайтом используя Camoufox библиотеку?
- 2 подписчика
- 14 окт.
- 120 просмотров
0

ответов
PHP

Простой
Как точно работает скрипт на RoadRunner?
- 1 подписчик
- 13 окт.
- 208 просмотров
1

ответ
PHP

+1 ещё

Простой
Стоит ли использовать файловый сервер в проекте?
- 2 подписчика
- 13 окт.
- 254 просмотра
3

ответа
PHP

+1 ещё

Средний
Почему некорректно работает регулярное выражение в PHP?
- 1 подписчик
- 06 окт.
- 270 просмотров
3

ответа
Показать ещё Загружается…

PHP-разработчик

Остров Сокровищ

от 180 000 до 250 000 ₽

PHP-разработчик (Symfony)

Мегаплан

от 160 000 ₽

Разработчик PHP/Go

ЭТП ГПБ / VESNA

До 220 000 ₽