Как парсить контент, сгенерированный JS-ом на Python. Что посоветуете?
Я в этом деле новичок, поэтому сразу попрошу не забрасывать мен камнями)
Сегодня куда не глянь - везде JS. Что собственно существенно усложняет парсинг, по крайней мере на Python так уж точно.
Двух библиотек: Requests в связке с bs4 - недостаточно. Либо я чего-то не знаю, в этом случае буду признателен, если тыкнете носом куда следует (в документацию).
Собственно вопрос: как и при помощи чего лучше всего парсить определенный контент со страниц, которые генерируются JS-ом?
Зависит от контента. Либо selenium либо, если, парсить надо то, что страница подгружает по API, то можно перехватить запрос к апишке и написать свою реализацию на requests\aiohttp\по вкусу.
поддержу. не всегда Селениум нужен (да и долго, порой). Поизучайте сначала то, как сервер отдает контент (или приложите ссылку сервиса). Порой, нужно просто покопаться в том, как уходят запросы и как они возвращаются. И никакой Селениум не нужен.