Как метод лучше использовать для получения инфы и контента с другого сайта?
Здравствуйте!
Требуется получить данные с одного сайта, который выводит инфу о товаре после get-запроса.
Допустим страницу с инфой о товаре можно найти по ссылке site.com/?article=nbX123q
---------------
В интернете нашел два метода:
1. Использование file_get_contents()
2. Использование loadHTMLFile
---------------
Я еще такие задачи не делал, поэтому вопрос: какой из них лучше использовать? Может есть какие-либо удобные библиотеки для этого. Так как если честно мне надо получить различную инфу с двух схожих сайтов и вывести на нашем.
И интересен такой момент: на втором сайте данные могут подгружаться долго, все это время там висит анимация загрузки на месте блока с инфой. Если использовать вышеуказанные два метода, они дождутся полной загрузки контента или спарсят страницу во время ajax-загрузки?
никакой из вышеперечисленных. Курите curl. По поводу ajax-запросов - никаким из методов не выполняется, либо пользуете имитатор браузера, либо исполняете их сами
Ок, смог получить весь контент страницы с помощью curl. А как теперь получить контент с определенного div-а? Тогда придется все равно использовать file_get_contents верно? Лучше уж сразу тогда этот метод.
Aljo, curl скачивает. Чтобы разобрать HTML нужен парсер, и тут как раз может помочь упомянутый вами loadHTMLFile.
Из более высокоуровневого можете посмотреть DiDom, symfony DomCrowler, zend_dom_query и аналоги.
В поиске вам часто будет встречаться simple HTML dom, но осторожне с ним - он порядком устарел, хотя базовые фичи и сработают.