Задать вопрос
@TechNOIR

Powershell+Selenium. Как обойти каптчу?

Добрый день.
Написал скрипт парсинга информации, но на сайте скрипт натыкается вскоре на каптчу и валится.
Как распоздать картинку я уже нашел. Через стороннее API.
НО! Ссылка на картинку каптчи выглядит так:
http://www.site.ru/captcha.ashx?guid=d7s8f7sdf9sd798f

Как получить картинку данную? Есть идея конечно сделать скриншот, тогда в данном случае как сделать скриншот конкретного объекта (каптчи)? Напримет может выделить как-то обрать с помощью Selenium и снять скриншот с области.
Есть идеи,товарищи знатоки? Спасибо заранее
  • Вопрос задан
  • 333 просмотра
Подписаться 3 Простой Комментировать
Пригласить эксперта
Ответы на вопрос 1
dimonchik2013
@dimonchik2013
non progredi est regredi
from selenium import webdriver
from PIL import Image

fox = webdriver.Firefox()
fox.get('http://toster.ru/')

# now that we have the preliminary stuff out of the way time to get that image :D
element = fox.find_element_by_id('hlogo') # find part of the page you want image of
location = element.location
size = element.size
fox.save_screenshot('screenshot.png') # saves screenshot of entire page
fox.quit()

im = Image.open('screenshot.png') # uses PIL library to open image in memory

left = location['x']
top = location['y']
right = location['x'] + size['width']
bottom = location['y'] + size['height']


im = im.crop((left, top, right, bottom)) # defines crop points
im.save('screenshot.png') # saves new cropped image


иногда нужно бывает промотать до конца страницы, тогда чуть сложнее
Ответ написан
Комментировать
Ваш ответ на вопрос

Войдите, чтобы написать ответ

Похожие вопросы