Как последовательно перейти по нескольким ссылкам curl?

Question

fomenko_alexandr @fomenko_alexandr

Как последовательно перейти по нескольким ссылкам curl?

Здравствуйте мастера.
Вот осваиваю curl. Учусь парсить даные (ходят слухи, что это пригодится для интернет-магазина), но я использую для парсинга картинок, что очень удобно.

Вот пытаюсь написать скрипт, который авторизируруется на сайте (это получилось), берет регуляркой ссылку (это тоже получилось), и переходит по этой ссылке (что никак не получается). Ссылка парсится рабочая. При переходе вручную, всё выполняется (обновляются данные), но не выходит это сделать автоматически.

Есть ли вариант сделать это последовательно, не использую мультикурла, и прочих классов?

<?php

$url = 'http://url';

$ci = curl_init();
curl_setopt($ci, CURLOPT_URL, $url);
curl_setopt($ci, CURLOPT_RETURNTRANSFER, true);
curl_setopt($ci, CURLOPT_AUTOREFERER, 1);
curl_setopt($ci, CURLOPT_USERAGENT, "Mozilla/4.0 (compatible; MSIE 5.01; Windows NT 5.0)");
curl_setopt($ci, CURLOPT_COOKIEFILE, $_SERVER['DOCUMENT_ROOT'].'/coo.txt');
curl_setopt($ci, CURLOPT_COOKIEJAR, $_SERVER['DOCUMENT_ROOT'].'/coo.txt');

curl_setopt($ci, CURLOPT_FOLLOWLOCATION, 10);
curl_setopt($ci, CURLOPT_HEADER, 1);
curl_setopt($ci, CURLOPT_POST, 1);

curl_setopt($ci, CURLOPT_POSTFIELDS, "log=log&password=pass");
$result = curl_exec($ci);
curl_close($ci);

echo '<pre>';
preg_match('~<a href="(.*)">.*(Добавить|Взять|Положить).*<\/a>~U', $result, $found);
preg_match('~<a href=".*">~', $result, $found);
print_r($found);

$link = $url.'/'.$found[1];

$ci2 = curl_init();
curl_setopt($ci2, CURLOPT_URL, $link);
curl_setopt($ci2, CURLOPT_HEADER, 1);
curl_setopt($ci2, CURLOPT_FOLLOWLOCATION, 10);
curl_setopt($ci2, CURLOPT_USERAGENT, "Mozilla/4.0 (compatible; MSIE 5.01; Windows NT 5.0)");
curl_setopt($ci2, CURLOPT_COOKIEFILE, $_SERVER['DOCUMENT_ROOT'].'/coo.txt');
curl_setopt($ci2, CURLOPT_COOKIEJAR, $_SERVER['DOCUMENT_ROOT'].'/coo.txt');
curl_setopt($ci, CURLOPT_POST, 1);
$exec = curl_exec($ci2);
curl_close($ci2);

print_r($ci2);


?>

Подскажите пожалуйста, как это можно реализовать

Вопрос задан более трёх лет назад
991 просмотр

1 комментарий

Подписаться 1 Оценить 1 комментарий

Помогут разобраться в теме Все курсы

Нетология

Веб-разработчик с нуля: профессия с выбором специализации

14 месяцев

Далее
Хекслет

PHP-разработчик

10 месяцев

Далее
Stepik

PHP (pro)

2 недели

Далее

Пригласить эксперта

Ответы на вопрос 3

7 комментариев

fomenko_alexandr @fomenko_alexandr Автор вопроса

а как можно открыть ссылку в новой вкладке браузера?

Написано более трёх лет назад
Ilya @glebovgin

fomenko_alexandr: эм.. если учесть, что мы сейчас говорим о php, то мне этот вопрос вообще не понятен.

Написано более трёх лет назад
fomenko_alexandr @fomenko_alexandr Автор вопроса

Ilya: Хорошо) спасибо)

Написано более трёх лет назад
Ilya @glebovgin

fomenko_alexandr: Основной вопрос в итоге решился? curl_setopt($ci2, CURLOPT_RETURNTRANSFER, true); помогло?

Написано более трёх лет назад
fomenko_alexandr @fomenko_alexandr Автор вопроса

Увы, но но нет( не работает(

Написано более трёх лет назад
fomenko_alexandr @fomenko_alexandr Автор вопроса

И правда странно получается.
Вручную в скрипт ввожу тот $link, что получается достать, так работает.
А чтобы на лету оно генерировало, не проходит

Написано более трёх лет назад
Ilya @glebovgin

fomenko_alexandr: да потому, что $link у вас неправильно регулярками вытаскивается. К тому же вы дважды делаете preg_match и неясно откуда именно вы ждете $found - из первого или второго вызова. Короче - разберитесь с правильным получением $link. В вызове второго curl явных проблем я не вижу, да и вы проверили, что он работает.

Написано более трёх лет назад

1 комментарий

2 комментария

Ваш ответ на вопрос

Войдите, чтобы написать ответ

Похожие вопросы

PHP

+2 ещё

Средний
Как решить проблему с smtp сервером?
- 1 подписчик
- 03 июн.
- 296 просмотров
1

ответ
Веб-разработка

+2 ещё

Средний
Как избежать вездесущего agentic coding и остаться в IT?
- 5 подписчиков
- 01 июн.
- 3076 просмотров
11

ответов
PHP

Средний
Как составить регулярное выражение?
- 1 подписчик
- 31 мая
- 189 просмотров
2

ответа
PHP

+2 ещё

Простой
Как настроить php_curl для php8 под windows?
- 1 подписчик
- 28 мая
- 152 просмотра
3

ответа
Веб-разработка

+2 ещё

Средний
Как правильно хранить видео в Django?
- 2 подписчика
- 28 мая
- 414 просмотров
3

ответа
Веб-разработка

Простой
Какую панель для хостинга выбрать в моём случае?
- 2 подписчика
- 25 мая
- 461 просмотр
6

ответов
Веб-разработка

+1 ещё

Средний
Изоляция сетевого слоя (WebSockets/Fetch) в Web Worker для высоконагруженного UI: используют ли такой паттерн в реальном проде?
- 1 подписчик
- 24 мая
- 193 просмотра
4

ответа
PHP

Простой
При правильном вводе каптчи не прегистрируется как исправить?
- 1 подписчик
- 24 мая
- 129 просмотров
2

ответа
Веб-разработка

+1 ещё

Средний
Safari помечает легитимный сайт как мошеннический. Google clean, Apple не отвечает. У кого был похожий опыт?
- 2 подписчика
- 22 мая
- 191 просмотр
2

ответа
Веб-разработка

+2 ещё

Сложный
Сайт висит при первом заходе на него. Как такое исправить?
- 3 подписчика
- 20 мая
- 1133 просмотра
4

ответа
Показать ещё Загружается…

Для
ходят слухи, что это пригодится для интернет-магазина
есть WPGRabber.
В случае вашего кода проверьте свой coo.txt между вызовами curl

Answer 1 · 2016-11-07 22:11:30

День добрый.

Вам
curl_setopt($ci, CURLOPT_POST, 1) (upd: я уже заметил, что не в этом дело)
в данном случае не нужен. Вы же не отправляете никаких POST-данных.
Если $link точно верный, то вы получите в $exec необходимые данные.

UPD: и вы забыли curl_setopt($ci2, CURLOPT_RETURNTRANSFER, true);

Answer 2 · 2016-11-08 01:00:15

Владислав Старцев @esvlad

Веб-разработчик

Для парсинга советую, библиотеку SimpleHtmlDOM
Почитать о ней можно тут.
Не придется париться с регулярками.

Ответ написан более трёх лет назад

1 комментарий

Answer 3 · 2016-11-07 22:09:10

ходят слухи, что это пригодится для интернет-магазина

Какого такого магазина?

Нужно сделать echo $link; и посмотреть что там.

Как последовательно перейти по нескольким ссылкам curl?

Войдите, чтобы написать ответ

Минуточку внимания

Войдите на сайт