Как спарсить всю страницу со скриптами и картинка с помощью Phantomjs?
Есть ли у вас примеры или готовые решения для парсинга всей страницы со всеми скриптами и картинками с помощью PhantomJS? По примерам из гугла получилось только спарсить html и css, скрипты и картинки с убитыми ссылками. Буду благодарен за помощь.
vserv: все что угодно можно делать, если остановитесь на этом продукте, используйте его в async await нативном седьмой ноды и будет вам счастье
типо:
async function go() {
try{
nightmare = Nightmare({show: true});
let html = await nightmare.goto(href);
console.log('resp code: ', html.code);
let data = await nightmare.evaluate((selector)=>{
let el = document.querySelector(selector);
return el !== null? el.textContent : null;
});
} catch(error){
console.error(errror);
}
finaly {
await nightmare.end();
}
Илья: я на практике покорял его, та рекомендация по стилю кода взята из опыта работы с ним. Сейчас народ чаще пишет в генераторах с модцлем во, но это не так удобно.