good_br
@good_br
учусь

Парсер для WP Scrapes не собирает все фото из галереи. Как исправить?

При парсинге с помощью WP-плагина Scrapes дублируются фото, и из слайдера достаются только миниатюры. Возможно, проблема с xpath-запросом, так как он выставляются не вручную, а через визуальный редактор. Вот пример для товара:

Запрос:
//div[contains(concat (" ", normalize-space(@class), " "), " card-left ")]


Ссылка на источник товаров:
18+ https://www.wildberries.am/catalog/8083488/detail....

Ссылка на наш сайт:
18+ https://shop.telebotpro.com/product/triviaa/

Возможно, если вручную составить запрос для галереи, то результат был бы другой, но я, к сожалению, не умею это делать.
  • Вопрос задан
  • 49 просмотров
Пригласить эксперта
Ответы на вопрос 1
alekciy
@alekciy
Вёбных дел мастер
Можно без веб драйвера данные взять. Там в исходной коде есть JavaScript код в котором все нужные данные есть:
wb.spa.init({
    router: {
        routes: routes,
        routesDictionary: routesDictionary,
        currentRoute: "SpaProductCardEntrypoint",
        modules:  {тут-данные},
        ssrModel: {...},
    },
    seoHelper: { ... }
});

Можно просто загрузить контент страницы, регуляркой найти там wb.spa.init и взять внутренний JSON.
Ответ написан
Ваш ответ на вопрос

Войдите, чтобы написать ответ

Войти через центр авторизации
Похожие вопросы