Здравствуйте. Посоветуйте, что лучше всего заюзать.
Нужно сделать парсер для сайта, но чтобы спарсить, нужно кнопочки нажимать. Куки не нужны, но нужно динамическое переключение прокси (чтобы сайт не забанили).
Спасибо.
devalone, не костыльное, а полноценный браузеры плагин на 100% выполняющий нужные вам функции по парсингу и который гарантированно не попадает в блок, так как ничем не будет отличатся по поведению и параметрам от обычных посетителей.
Возможно вас смущает, что предлагаю за деньги, но суть здесь в том, что для создания плагина нужно время, от 3 - 7 дней. Лично я не готов столько своего времени выкинуть на благотворительность, исключительно за спасибо, поэтому только платно.
Если знакомы с Python'ом, можете заюзать связку Python + Scrapy + Splash + Proxy - получится весьма мощная система, которая умеет все что вам нужно, от парсинга простых сайтиков, до сайтов, которые работают с front-end фреймворками.
Богдан, Что значит лучше? По каким параметрам? Для кого?
Разумеется puppeteer намного хуже чем selenium.
Сами подумайте - я отлично знаю selenium и вообще не работал с puppeteer. Конечно же он хуже.
Можно использовать обычные запросы на python с обвязкой с tor если кнопочки не нужно нажимать, а так если сайт требует полноценной работы то как сказали выше selenium webdriver. Из минусов selenium-a могу выделить пока что только ограниченную эмуляцию ввода/вывода/интерактива с веб страницей. Возможно это так оптимизация работает, но в этом точно есть минус.