Как парсить постоянно подгружаемую страницу на питоне?
Так, я знаю что это можно сделать с помощью Selenium но как.
Допустим у нас есть страница одного сайта печать будет с мангой( :) ). И когда прокручиваешь в самый низ запускается код джс(я так думаю) и генерирует новые елементы и так по кругу. Как парсить подобную страницу ?.
(Если можно не пугайте:3).
IDzone-x, Теоретически да, но скорее всего просто так не получится. Так как нужно передавать в запросе некий "CSRF token". Чтобы его передать, сначала нужно понять откуда он берется, и как формируется.
Сергей Карбивничий, я так и думал что Виктор зделает так чтобы парсить сложно было :)
Ну я буду учиться Selenium-му .
И плюс можете посоветовать сайт для парсингу js яб хотел потренироваться:)
IDzone-x, Я когда-то на этом тренировался - https://finance.i.ua/market/kiev/? Там есть ссылка "показать" номер телефона. По клике на неё, показывается полностью номер. С помощью Selenium там вообще проблем нет. А я парсил с помощью requests и BS4. Там прикол в том, что номер закодирован в Base64. И парсить номера можно чем угодно. Также можете попробовать Olx.ua и avito.ru. Там номера телефонов тоже показываются после клика. На авито после клика показывается номер телефона не текстом, а картинкой. Но в python такую картинку в текст перевести можно с помощью пары строк кода(и использованием сторонних библиотек).