• Парсинг сайта, вытащить изображения?

    @PetrovUlsk Автор вопроса
    DanKud, Отлавливаю массив ссылок на изображения
    <pre>
    <?php
    $url = "http://ritg.ru";
    
    $curl = curl_init(); 
    curl_setopt($curl, CURLOPT_URL, $url); 
    curl_setopt($curl, CURLOPT_RETURNTRANSFER, 1); 
    curl_setopt($curl, CURLOPT_FOLLOWLOCATION, 1);
    
    $site = curl_exec($curl);
    
    preg_match_all('/<img.+?src=["|\']{1}(.*?)["|\']{1}/', $site, $res); 
    var_dump($res[0]);
    
    //Ниже кусок кода чтобы сохранить данные изображения, но мне вместо <b>'img.png'</b>, нужно подставлять тот самый url который нашли
    $img = $res[0];
    file_put_contents('img.png', $img);
    ?>


    и получаем
    <html><head></head><body><pre>array(5) {
      [0]=&gt;
      string(49) "<img src="/local/templates/ritg2017/img/logo.png" "="" [1]="">
      string(48) "<img src="/local/templates/ritg2017/img/nav.png" "="" [2]="">
      string(54) "<img src="/local/templates/ritg2017/img/nav-close.png" "="" [3]="">
      string(79) "<img alt="globus" src="/upload/iblock/b3a/b3a5167acc32fb4d5fcd4d55c59213e1.png" "="" [4]="">
      string(46) "</pre></body></html>


    Но в ссылке на изображение отсутствует url сайта, как добавить его чтобы он присваивался. Т.е. нужно сформировать Абсолютный путь до изображения

    5c90a9e54273c318484828.png

    Если перейти на сайт ritg.ru то наблюдаем Относительную ссылку на изображение которое получили
    <div class="head-logo">
                    <a href="/">
                    <img src="/local/templates/ritg2017/img/logo.png" alt="logo">
                    </a>
                </div>
  • Парсинг сайта, вытащить изображения?

    @PetrovUlsk Автор вопроса
    DanKud, готовое решение скрипта с сайта preview.codecanyon.net/item/website-review/full_sc...

    WebReview_v4.3, действующая версия на их сайте 5.5, но там так же нету отображение изображений. Только их количество
  • Парсинг сайта, вытащить изображения?

    @PetrovUlsk Автор вопроса
    DanKud,
    // Update deprecated tags, images, headings
    		$command -> update("{{content}}", array(
    			'deprecated' => 			@json_encode($this -> document["deprecatedTags"]),
    			'headings' => 				@json_encode($this -> content["headings"]),
    			'isset_headings' => 	$this -> content["issetHeadings"],
    			'total_img' => 				$this -> image["totalCount"],
    			'total_alt' => 				$this -> image["totalAlt"],
    		), 'wid=:wid', array(':wid' => $wid));


    // Insert deprecated tags, headings, images
    		$command -> insert("{{content}}", array(
    			'wid' => 	$wid,
    			'deprecated' => @json_encode($this -> document["deprecatedTags"]),
    			'headings' => @json_encode($this -> content["headings"]),
    			'isset_headings' => $this -> content["issetHeadings"],
    			'total_img' => $this -> image["totalCount"],
    			'total_alt' => $this -> image["totalAlt"],
    		));
  • Парсинг сайта, вытащить изображения?

    @PetrovUlsk Автор вопроса
    slo_nik, вот я не понял как вывести хотя бы список этих изображений которые нашлись на сайте. Как путь получить?
  • Парсинг сайта, вытащить изображения?

    @PetrovUlsk Автор вопроса
    slo_nik, с любого сайта который хотим распарсить 5c8fdd5118f25653750971.png5c8fddac6d64c547567897.png