@daMage

Почему при выборке из бд записи повторяются?

Добрый вечер. Пытаюсь получить изображения с сайта shutterstock, но при попытке грабинга попадаются записи с одинаковым id. Есть контроллер, который принимает в качестве параметров страницу, количество изображений на страницу и категорию.

ae4b32015d0b4433ae1b214892df115a.png
Сканирую 21 категорию: www.shutterstock.com/cat-21-Interiors.html, в которой 4296 страниц и ~429600 изображений, однако в бд заносится порядка 250000 уникальных записей. В чем проблема, не знаю, может быть, она кроется в параметрах src, search_source_id, tracking_id, предназначение которых мне неизвестно. Кто-нибудь сталкивался с похожей практикой? Данные получаю в таком виде:
acb22a48fc42426780c47c0d2f3ae77b.png
  • Вопрос задан
  • 2664 просмотра
Пригласить эксперта
Ваш ответ на вопрос

Войдите, чтобы написать ответ

Войти через центр авторизации
Похожие вопросы
Ведисофт Екатеринбург
от 25 000 ₽
YCLIENTS Москва
от 200 000 до 350 000 ₽
от 300 000 до 500 000 ₽
06 мая 2024, в 14:54
1000 руб./за проект
06 мая 2024, в 14:53
45000 руб./за проект
06 мая 2024, в 14:31
200000 руб./за проект