Как реализовать парсер Wildberries по поисковым запросам (ссылки типа https://www.wildberries.ru/catalog/0/search.aspx?search={Запрос})?
Задача состоит в том, что необходимо реализовать скрипт, который будет запускаться на VPS, искать позицию переданного ему товара по переданному запросу.
Проблема началась тогда, когда попытался просто спарсить html, введя готовую ссылку с запросом, получал пустой документ с шапкой и футером. Реализовал через webdriver, возникла проблема с запуском на хосте.
Подскажите, как можно выдернуть эти данные без использования вебдрайвера?
(Предпочтительно на C#, PHP, JavaScript)
Может вопрос сложнее, чем мне видится, но с этим должен справится node js, а именно модули node-fetch (для реализования запросов к сайту) и cheerio (для парсинга полученного html документа)
Спасибо за ответ, в ходе изучения разобрался с вопросом. Действительно - ваше решение близко, но не является верным. Момент такой, что при переходе по запросу - формируется запрос к файлу генерирующий JSON. Задача свелась к тому, чтобы разобраться - как именно он генерит GET-параметры и запрашивать их.
Реализовал на PHP.
На JS бы это выглядело так -
fetch(url (нужно было посмотреть несколько ссылок и понять по какой логике он их генерит, реализовать логику генерации ссылок и пихать сюда))
.then ((response) => {
if (response.ok) return response.json()
})