@daMage

Почему при выборке из бд записи повторяются?

Добрый вечер. Пытаюсь получить изображения с сайта shutterstock, но при попытке грабинга попадаются записи с одинаковым id. Есть контроллер, который принимает в качестве параметров страницу, количество изображений на страницу и категорию.

ae4b32015d0b4433ae1b214892df115a.png
Сканирую 21 категорию: www.shutterstock.com/cat-21-Interiors.html, в которой 4296 страниц и ~429600 изображений, однако в бд заносится порядка 250000 уникальных записей. В чем проблема, не знаю, может быть, она кроется в параметрах src, search_source_id, tracking_id, предназначение которых мне неизвестно. Кто-нибудь сталкивался с похожей практикой? Данные получаю в таком виде:
acb22a48fc42426780c47c0d2f3ae77b.png
  • Вопрос задан
  • 2664 просмотра
Пригласить эксперта
Ваш ответ на вопрос

Войдите, чтобы написать ответ

Похожие вопросы