Как спарсить сайт, который требует авторизацию с помощью гугла?
Захотел спарсить маркетплейс, на котором требуется авторизация с помощью гугл аккаунта прежде чем появится доступ к страницам. Тут же встал вопрос: как это сделать?
P.s. Парсить сайты я умею, нужен именно совет по авторизации с помощью гугл аккаунта
Ну это не совсем так, раз проблема с авторизацией оказалась таким блокером.
Сайты не хранят аккаунты пользователя в гугле, следовательно при авторизации через гугл каждый сайт все равно создает локального пользователя и после авторизации выдает ему необходимые токены. Следовательно если ты не умеешь авторизироваться скриптом, нужно авторизироваться в браузере, получить все куки с токенами и использовать их в парсере, возможно также подделав User-Agent.
Самый простой способ это написать парсер на JavaScript и далее запустить его в консоли браузера, так как браузер уже авторизован на целевом сайте вашему скрипту останется лишь зайти и собрать нужные вам данные.
Проблема в том, что нужно доставать необходимые данные из html страницы путем подачи запросов(не использовать браузер вообще). Для этого хочу использовать библиотеку requests и bs4, но не могу понять как авторизоваться через гугл акканут.