@artmart999

Парсинг страницы инстаграм с помощью Guzzle и Didom, как?

Добрый день уважаемые. Хочу получить данные из данного значения, со страницы пользователя инстаграм: 5ffeadc789ecd835613587.png

В данном месте инстаграм предоставляет json информацию о странице пользователя. Но есть проблемка.
Дело в том, что когда открываешь страницу профиля инстаграма, то первым делом на секунду-две открывается следующая картинка:
5ffeae4605368880396780.png
И там в исходном коде нет нужного мне значения.
а затем открывается уже сама страница профиля.
Как заставить Guzzle при октрытии ссылки подождать пару секунд и спарсить открывшуюся страницу профиля? Заранее спасибо.

Вот мой код:

<?php

include "../vendor/autoload.php";

use GuzzleHttp\Client;
use DiDom\Document;

$client = new Client();
$domain = "https://www.instagram.com/instagram/";

$response = $client->get($domain);
$html = (string) $response->getBody();

for ($i = 0; $i <= 31; ++$i) { 
	$html = str_replace(chr($i), '', $html); 
}

$html = str_replace(chr(127), '', $html);

preg_match_all('/<script type="text\/javascript">window\._sharedData = \{(.*)\};<\/script>/', $html, $matches);

$array = json_decode('{' . $matches[1][0] . '}', true);

echo '<pre>';
print_r($array);
echo '</pre>';
  • Вопрос задан
  • 300 просмотров
Пригласить эксперта
Ваш ответ на вопрос

Войдите, чтобы написать ответ

Войти через центр авторизации
Похожие вопросы