@nezzard

Как парсить контент из Iframe?

Добрый день, перерыл пол интернета, ничего не могу найти.
Суть задачи, имеется iframe в котором есть html>body и так далее.
Мне нужно взять ссылку из определенного контейнера, в интернете почитал что если iframe на другом домене то такой возможности нету.
Но в англоязычных источниках проскакивала информация, что можно использовать headless браузеры для таких дел, парсить страницу и потом делать ее разбор.
Подскажите все таки это возможно? Если да, то в какую сторону смотреть?
  • Вопрос задан
  • 1264 просмотра
Решения вопроса 1
@nezzard Автор вопроса
Нашел решение
Использую puppeteer, добавил агрумент --disable-web-security, потом прошелся по всем iframe и элементам которые мне нужны, дошел до нужной ссылки
Ответ написан
Комментировать
Пригласить эксперта
Ответы на вопрос 3
webinar
@webinar Куратор тега PHP
Учим yii: https://youtu.be/-WRMlGHLgRg
Не совсем понятно почему в тегах и php и node? Вам на чем реализация нужна? В php можно просто реализовать CURL и получить контент страницы и распарсить его. Но тогда возникает вопрос "а зачем нам iframe если мы уже получили его контент?" Хотя возможно для seo нам не всегда хочется вставлять в свой контент чужой, так что можно иметь отдельно ifame и отдельно данные из CURL.
Если речь о node, то там действительно есть безбашенные (Headless) браузеры, читать тут:
https://habr.com/company/oleg-bunin/blog/421137/
Ответ написан
@RidgeA

Подскажите все таки это возможно? Если да, то в какую сторону смотреть?


headless браузеры
Ответ написан
Ваш ответ на вопрос

Войдите, чтобы написать ответ

Войти через центр авторизации
Похожие вопросы