onlexelon
@onlexelon
Делаю дела с Китаем!

Настройка datacol не парсит картинки и нформацию с вкладки сайта. Как подобрать правильное Xpath выражение?

Всем привет!
Перепробовал уже кучу разных вариантов, но видимо опыта не хватает, ни у меня, ни у ребят с биржи фриланса.
Суть такая, мне нужно спарсить товары с сайта huananzhi.com :
Название, Картинки, Краткое описание, Все данные во вкладке product details (сделать их атрибутами), Ссылки на драйвера и Bios во вкладке technical support (то есть чтобы было так же как на сайте поставщика)
То что я выделил как раз у меня не получается спарсить ни в какую.
Я подобрал Xpath //img[@class='img-responsive'] но картинки при этом и ссылки не парсит
Ссылка для парсинга на пример товара www.huananzhi.com/html/1/184/185/491.html
Ссылка на проект datacol 7.30 https://disk.yandex.ru/d/51oW6nIotJM3hA
Помогите подобрать XPath для парсинга всех картинок товара. А так же не могу понять почему не парсит вкладку с биосом и драйверами.
  • Вопрос задан
  • 126 просмотров
Пригласить эксперта
Ответы на вопрос 1
Ichi
@Ichi
Увлекаюсь программированием
Судя по коду сайту - картинки грузятся позже с помощью js. Поэтому при запросе их банально ещё нет.

Можно парсить JS. На странице есть код:
setimage: function setimage() {
				var litpicList = "/upload/1/article/1592963023206.jpg|/upload/1/article/1592977873403.jpg|/upload/1/article/1592977873590.jpg|/upload/1/article/1592977873762.png" 
				var images = new Array();


То есть можно найти на странице регулярков вида regex = /var litpicList = "(.*)"/gm;
Где и будет список картинок с разделителем |
Ответ написан
Комментировать
Ваш ответ на вопрос

Войдите, чтобы написать ответ

Войти через центр авторизации
Похожие вопросы