alexanev6
@alexanev6
UX / UI дизайнер

Как через PHP curl спарсить все страницы сайта и найти определенные названия посредством preg_match?

Если необходимо спарсить все названия смартфонов из карточек, например с сайта Мвидео, то как это сделать на всех страницах? Например, вот этот код выдает названия смартфонов только с этой страницы, но как обойти и все остальные?
(знаю, регулярное выражение несовершенно)) но я пока пытаюсь понять принцип обхода сайта с помощью CURL

<?php
    $ch = curl_init('https://www.mvideo.ru/smartfony-i-svyaz/smartfony-205');

    curl_setopt($ch, CURLOPT_RETURNTRANSFER, true);
    curl_setopt($ch, CURLOPT_FOLLOWLOCATION, true);


    $result = curl_exec($ch);

    preg_match_all('/Смартфон\s+.*\s+?"/', $result, $matches);
    
   
    print_r($matches);
  • Вопрос задан
  • 158 просмотров
Пригласить эксперта
Ответы на вопрос 1
@grinat
Первым запросом дерагаешь ссылки из пагинатора, затем их обходишь. Да и зачем тебе регулярки? Используй xpath хотя бы.
Ответ написан
Комментировать
Ваш ответ на вопрос

Войдите, чтобы написать ответ

Похожие вопросы