Как парсить контент из Iframe?

Question

nezzard @nezzard

PHP
Node.js

Как парсить контент из Iframe?

Добрый день, перерыл пол интернета, ничего не могу найти.
Суть задачи, имеется iframe в котором есть html>body и так далее.
Мне нужно взять ссылку из определенного контейнера, в интернете почитал что если iframe на другом домене то такой возможности нету.
Но в англоязычных источниках проскакивала информация, что можно использовать headless браузеры для таких дел, парсить страницу и потом делать ее разбор.
Подскажите все таки это возможно? Если да, то в какую сторону смотреть?

Вопрос задан более трёх лет назад
1363 просмотра

1 комментарий

Подписаться 1 Простой 1 комментарий

Помогут разобраться в теме Все курсы

Нетология

Веб-разработчик с нуля: профессия с выбором специализации

14 месяцев

Далее
Хекслет

PHP-разработчик

10 месяцев

Далее
Stepik

PHP (pro)

2 недели

Далее

Решения вопроса 1

Комментировать

Пригласить эксперта

Ответы на вопрос 3

5 комментариев

nezzard @nezzard Автор вопроса

Мне не принципиально php или node, на чем можно на том и буду делать.
Я с помощью curl не смог получить содержимое айфрейма.
Внутри айфрейма (который не на моем домене) находится тег внутри которого ссылка, которую мне и нужно получить

Написано более трёх лет назад
Максим Тимофеев @webinar Куратор тега PHP

nezzard, с помощью CURL надо получать содержимое страницы по url, а не содержимое айфрейма. У iframe есть атрибут src, там содержится url c которого он получает данные, так что просто отправляете CURL-ом запрос на этот url и парсите результат (достаете от туда ссылки и что угодно еще). Есть куча библиотек для парсинга под php, которые с этим справятся, например:
https://habr.com/post/69149/

Написано более трёх лет назад
nezzard @nezzard Автор вопроса

Максим Тимофеев, Так не получается у них стоит защита какая-то, при открытии этого урл напрямую там ничего не выводится

Написано более трёх лет назад
Максим Тимофеев @webinar Куратор тега PHP

nezzard, в iframe открывается, а по curl нет? Пример iframe в студию

Написано более трёх лет назад
nezzard @nezzard Автор вопроса

Максим Тимофеев, jsfiddle.net/ahk1wzdt

Написано более трёх лет назад

1 комментарий

Комментировать

Ваш ответ на вопрос

Войдите, чтобы написать ответ

Похожие вопросы

PHP

+1 ещё

Простой
Как работать с Manticore Search на php?
- 1 подписчик
- вчера
- 78 просмотров
1

ответ
PHP

Простой
PDO не видит внутри функции?
- 1 подписчик
- 25 апр.
- 193 просмотра
2

ответа
PHP

Средний
Как подключиться к серверу PHP и чтобы отображались исполнители?
- 1 подписчик
- 24 апр.
- 208 просмотров
3

ответа
PHP

+3 ещё

Средний
Как организовать автоматическую выдачу цифровых товаров после оплаты на чистом PHP?
- 2 подписчика
- 20 апр.
- 289 просмотров
3

ответа
PHP

Простой
Не работает яндекс ссылка прямая?
- 1 подписчик
- 07 апр.
- 202 просмотра
1

ответ
PHP

Простой
Почему слетает сайт при загрузке обработчика?
- 1 подписчик
- 02 апр.
- 225 просмотров
1

ответ
JavaScript

+2 ещё

Средний
Авторизация вконтакте как настроить?
- 2 подписчика
- 26 мар.
- 377 просмотров
1

ответ
Node.js

Простой
Как решить данную ошибку?
- 2 подписчика
- 20 мар.
- 265 просмотров
1

ответ
PHP

Простой
СТРОКА — где искать ее истоки на сайте?
- 1 подписчик
- 11 мар.
- 378 просмотров
2

ответа
PHP

Простой
Есть ли такая функция сравнения?
- 2 подписчика
- 09 мар.
- 328 просмотров
1

ответ
Показать ещё Загружается…

PHP-разработчик

Остров Сокровищ

от 15 000 до 250 000 ₽

Программист PHP

Базис-Центр • Коломна

от 70 000 до 250 000 ₽

PHP и Node.js разработчик

TripShock Adventures

от 1 000 до 2 500 $

Answer 1 · 2018-10-16 20:27:27

Нашел решение
Использую puppeteer, добавил агрумент --disable-web-security, потом прошелся по всем iframe и элементам которые мне нужны, дошел до нужной ссылки

Answer 2 · 2018-10-16 15:40:38

Не совсем понятно почему в тегах и php и node? Вам на чем реализация нужна? В php можно просто реализовать CURL и получить контент страницы и распарсить его. Но тогда возникает вопрос "а зачем нам iframe если мы уже получили его контент?" Хотя возможно для seo нам не всегда хочется вставлять в свой контент чужой, так что можно иметь отдельно ifame и отдельно данные из CURL.
Если речь о node, то там действительно есть безбашенные (Headless) браузеры, читать тут:
https://habr.com/company/oleg-bunin/blog/421137/