Ответы пользователя по тегу Парсинг
  • Как правильно сделать парсер для сайта на JS/jQuery?

    @ShinShil
    Да, парсинг делают через бекенд. Я делал на php. Сначала получал страницу через CURL. Потом парсил с помощью simplehtldom - небольшая библиотека, очень удобная и простая.

    Немного о CURL. Это просто для того чтобы сделать запрос. Ты ведь с компьютера открваешь страницы. Это происходит так: твой компьютер с помощью браузера делает запрос к серверу, тот высылает тебе html код, а браузер просто отображает его.

    $ch = curl_init();  
    curl_setopt($ch, CURLOPT_URL, 'http://forum.antichat.ru/'); 
    curl_setopt($ch, CURLOPT_RETURNTRANSFER, 1); 
    $result = curl_exec($ch); 
    curl_close($ch);


    Выше пример простейшего CURL, в если он подключён, то в $result должна находиться длиннющая строка с html кодом страницы. У него есть много настроек, можно устанавливать различные заголовки, типы запросов и т.п.

    При парсинге выбираешь все ссылки и потом проверяешь аттрибут href.
    Ответ написан
    Комментировать