волнует вопрос парсинга картинок из поисковика google/search. При get запросе получаю страницу гугла с картинками, но как их оттуда парсить? Если смотреть код элемента, то на такой странице прямых ссылок на картинки нет, но если открыть любую картинку, то ссылку можно достать, но происходит изменение в браузерной строке. Если вы знаете или у вас есть скрипт, то поделитесь им пожалуйста.
Скрипта нет, но примерно так может. Алгоритм в 3 этапа.
1. Получил гетом страницу результатов. Вытаскиваешь все url на картинки в массив. Можно урлы сократить.
оставив только tbnid и docid.
из страницы поиска
href="/imgres?imgurl=https%3A%2F%2Fcreditpower.ru%2Fimg%2Fcreditpower.jpg&imgrefurl=https%3A%2F%2Fcreditpower.ru%2F&tbnid=xu6eTWUHey5HiM&vet=12ahUKEwjE6fCu-qDxAhXTBhAIHZqrA0gQMygAegQIARB6..i&docid=RVPClAByBJmCLM&w=300&h=200&q=creditpower&hl=ru&ved=2ahUKEwjE6fCu-qDxAhXTBhAIHZqrA0gQMygAegQIARB6"
сокращенный
https://www.google.com/imgres?&tbnid=xu6eTWUHey5HiM&docid=RVPClAByBJmCLM
2. Далее идешь по массиву, открываешь урлы.
3. Берешь ссылки уже на полноценные картинки. И грузишь.
Гугл может капчу запросить. Но это уже другой вопрос.
Самого скрипта нет, но можно использовать связку из selenium и Pillow. Через селениум имитируешь клики по позициям, делаешь time.sleep() пока грузится страница с картинкой, а затем уже достаешь через селениум url сайта на котором он сейчас находится и отправляешь этот url в Font из Pillow, тем самым скачиваешь картинку.