Ответы пользователя по тегу Парсинг
  • Как спарсить raw html страницы?

    @hdworker
    Для страниц генерируемых на сервере pycurl
    Для ajax-страниц, запрашивающих инфу с сервера HtmlUnit
    Ответ написан
  • Научиться парсингу - с чего начать?

    @hdworker
    Для парсинга обычных страничек используйте php-либу phpQuery.
    Для парсинга ajax-стариничек, то есть страниц с динамически загружаемым контентом, которые phpQuery видит как пустые, используйте java-либу htmlUnit, с помощью которой можно написать простенький код получения и сохрания страницы в файл, который потом можно распарсить с помощью phpUnit.
    Язык селекторов phpQuery аналогичный jQuery, так что сложностей возникнуть не должно.
    Самый простой способ -- выбрать сайт, открыть его в f11 и тренироваться.
    Ответ написан
    Комментировать