@leha78

Как спарсить страницу если она имеет вид site.ru/?page=about?

Необходимо спарсить страницу site.ru/?page=about с помощью simple_html_dom

Но парсер берет данные с site.ru (получается главную страницу) игнорируя page=about

Как можно добиться того, чтобы он видел как site.ru/about
  • Вопрос задан
  • 206 просмотров
Решения вопроса 1
@mletov
А разве нельзя сразу сделать так?
$data = file_get_html('http://site.ru/about');
Или все равно контент стартовой отдает?

Ну и тут есть про передачу параметров
stackoverflow.com/questions/9497153/simple-html-do...
Ответ написан
Пригласить эксперта
Ответы на вопрос 1
DmitriyEntelis
@DmitriyEntelis
Думаю за деньги
1. Берем современную версию этого парсера, например https://github.com/sunra/php-simple-html-dom-parser
2. Скачиваем контент страницы любым способом. Если владельцы сайта слегка заморочились - возможно придется через curl сымитировать заголовки и прочее от Вашего браузера
3. $dom = HtmlDomParser::str_get_html( $str );

PS А вообще категорически не советую использовать что simple_html_dom, что любые другие поделки.
Решение на регулярных выражениях работает быстрее минимум на порядок
Ответ написан
Комментировать
Ваш ответ на вопрос

Войдите, чтобы написать ответ

Войти через центр авторизации
Похожие вопросы
YCLIENTS Москва
от 200 000 до 350 000 ₽
Ведисофт Екатеринбург
от 25 000 ₽
ИТЦ Аусферр Магнитогорск
от 100 000 до 160 000 ₽
25 апр. 2024, в 12:20
15000 руб./за проект
25 апр. 2024, в 12:08
300 руб./за проект
25 апр. 2024, в 11:49
25000 руб./за проект