Я пытаюсь вытащить загруженный html и url загруженной страницы из браузера.
Сразу отсекаем requests, urllib3, selenium и.т.п... Нужно именно из стандартного браузера
На сколько я понял, вся эта инфа храниться в озу.
Можно ли на python всё это прочесть?
Или возможно есть другие пути?
Мне нужно получить html и url загруженной страницы из реального браузера.
Или вы знаете способ как обойти cloudflare который работает на данный момент?
Реальный браузер может иметь гигабайт 20 виртуальной памяти, да еще наверняка обвешаной всякими песочницами, динамическими аллокаторами и прочим барахлом. Более того, вероятнее всего, страница в нем - это код на wasm, работающий уже внутри V8.
и тут вы такой появляетесь с идеей в этих гигабайтах искать базовый адрес урла, который открыт в браузере.
Тут гораздо проще будет откомпилировать свой браузер, который будет через сокет отдавать все что нужно куда нужно, хоть в тот же Бидон.
ну можно конечно попытаться понадеяться на лучшее и попытаться найти хэндл окошка, которое содержит урл - а вдруг вы очень везучий. Spy++ в этом может помочь.
Еще одна идея - посылать окну браузера хоткеи, чтобы выделить урл в адресной строке и скопировать его в буфер обмена. Авось повезет.