Добрый день, пытаюсь получить контент сайта, на котором основное содержимое подгружается ajax-ом.
Сразу понял, что curl-ом не получится т.к. сценарии не выполнятся, и поставил phantomJS.
Но проблема в том, что phantomJS выдает тоже самое, что и обычный curl.
<?php
$phantom_script= dirname(__FILE__). '/Get-website.js'. ' https://какой-то сайт/supply/p/orders/160075/?t=eb14959b-d89a-4ba6-a2ba-eacff2b8f747';
$response = shell_exec ('phantomjs --ssl-protocol=any ' . $phantom_script);
echo htmlspecialchars($response);
Скрипт:
var args = require('system').args;
var webPage = require('webpage');
var page = webPage.create();
var address = args[1];
page.open(address, function (status) {
if (status !== 'success') {
console.log(page.content); //content = Null
console.log('Unable to load the address! PHP');
phantom.exit();
} else {
window.setTimeout(function () {
console.log(page.content);
phantom.exit();
}, 5000); // Change timeout as required to allow sufficient time
}
});
Задержку и работу с https почитал, но все равно не работает..
Предполагаю, что просто сама библиотека устарела, но может кто поможет?
Заранее благодарен!