Задать вопрос

Как спарсить страницы с помощью PHP (адрес страниц один и тот же, но содержимое разное в зависимости от введённого логина)?

Кратко суть:
Есть список номеров зачеток студентов, по которым осуществляется вход на сайт с их результатами учёбы. Эти результаты надо спарсить, объединить и предоставить в удобном виде, на одной странице.
cda2147b717c4d3891ce66647c36cf37.pngТеперь всё по частям:
  1. Есть список номеров зачёток для входа на сайт.
  2. Есть страница, где осуществляется вход на сайт только по номеру зачётки (домен/sign_in/). Дальше страница с которой нам надо парсить данные (домен/archive/), доступна, естественно, только после входа, для каждого номера свои данные;
  3. Парсим данные, объединяем, выводим на нашем сайте в удобном виде.

Теперь вопросы:
  1. Как реализовать вход на сайт?
  2. Как дальше "перейти" на страницу с данными?
  3. И собственно, главный, как реализовать парсинг, какие инструменты/библиотеки использовать?

Всё с помощью php(!)

Структуры страницы, думаю описывать глупо, лучше, если Вы посмотрите всё сами.
Страница входа - goo.gl/2RFrN9
Страница с данными - goo.gl/jTQzhd (доступна после входа)
Номер - 13048050

P. S. В этом деле я новичок, c PHP знаком поверхностно (можно сказать, что совсем не знаю). Главный вопрос - как сделать вход, и парсинг?
  • Вопрос задан
  • 1479 просмотров
Подписаться 3 Оценить Комментировать
Решение пользователя Stalker_RED К ответам на вопрос (4)
Stalker_RED
@Stalker_RED
Авторизоваться можно через curl, например.
curl_setopt($curl, CURLOPT_POST, true);
curl_setopt($curl, CURLOPT_POSTFIELDS, "a=4&b=7");

А парсить при помощи Zend\Dom. Его можно как отдельный модуль взять, там всего три файлика.
$doc = new Zend\Dom\Query($html, 'utf-8');
        $links = $doc->execute('ul.menu a');
        foreach ($links as $link) {
            $url = $link->getAttribute('href');
        ...
Ответ написан