Как отдаются ссылки поисковиком?

Question

Tirend @Tirend

Парсинг

Как отдаются ссылки поисковиком?

Привет, я пишу парсер. Цель его работы такова - есть список запросов, программа поочереди отдает запрос в поисковик, ей возвращается страница ответа. Надо взять первый результат поиска и скачать все по указанному урлу.
Возникли проблемы следующего характера. Ссылку первого релевантного ответа я достал, но когда я перехожу по этой ссылке браузер отдает яваскрипт, т.е. ссылка не является ссылкой на тот ресурс, а это ссылка куда то в недра поисковика, который возвращает яваскрипт.
И вторая проблема - как все таки выкачать ресурс?

Вопрос задан более трёх лет назад
166 просмотров

2 комментария

Подписаться 2 Оценить 2 комментария

Помогут разобраться в теме Все курсы

Skillfactory

Профессия Python-разработчик PRO

12 месяцев

Далее
Stepik

Парсинг на Python для начинающих

2 недели

Далее
OTUS

iOS Developer

12 месяцев

Далее

Пригласить эксперта

Ответы на вопрос 3

1 комментарий

3 комментария

uwini @uwini

Если нужна помощь, пишите

Написано более трёх лет назад
Tirend @Tirend Автор вопроса

uwini: друг, подожди, конечно нужна! Дело в том, что я до мозга костей низкоуровневый прогер. Всю жизнь пишу под физический уровень: на плюсах, ассемблере и hdl-подобных языках. А этот парсер по долгу службы приходится писать. Я решил писать на шарпе, потому что там более менее для меня понятно - это раз и два - это программа для операторов - девушек, которым нужен дружнственный визуальный интерфейс. Вот. Я не буду тебя обременять сильно, я самодостаточен, но для освоения этой темы сне понадобится много времени. А если меня время от времени кто-то будет как бы направлять в нужную сторону, то я сам потихоньку допилю прогу. Что скажешь?

Написано более трёх лет назад
Tirend @Tirend Автор вопроса

uwini: куда писать то?

Написано более трёх лет назад

Ваш ответ на вопрос

Войдите, чтобы написать ответ

Похожие вопросы

Парсинг

Средний
Вся сложность парсинга Авито. Как это сделать правильно?
- 1 подписчик
- 26 нояб.
- 190 просмотров
1

ответ
Telegram

+1 ещё

Простой
Как спарсить подписчиков своего телеграм канала?
- 2 подписчика
- 20 нояб.
- 422 просмотра
2

ответа
Веб-разработка

+1 ещё

Простой
Каким образом правильно сделать скрипт?
- 2 подписчика
- 15 нояб.
- 366 просмотров
2

ответа
Python

+1 ещё

Сложный
Как автоматизировать работу с сайтом используя Camoufox библиотеку?
- 2 подписчика
- 14 окт.
- 193 просмотра
0

ответов
Парсинг

Простой
Как получить ID всех ПВЗ?
- 1 подписчик
- 24 сент.
- 267 просмотров
0

ответов
Парсинг

+1 ещё

Простой
Как увеличить охват поисковых фраз Wildberries и ускорить?
- 2 подписчика
- 23 сент.
- 206 просмотров
0

ответов
Парсинг

Простой
Как парсить несколько сайтов, отличающихся друг от друга?
- 2 подписчика
- 09 сент.
- 207 просмотров
3

ответа
Node.js

+4 ещё

Простой
В чем разница между selenium, playwright и puppeteer?
- 3 подписчика
- 09 сент.
- 297 просмотров
2

ответа
Node.js

+1 ещё

Простой
NODE.JS – парсинг контента. При скачивании изображений получаю битые файлы. Как поправить?
- 1 подписчик
- 08 сент.
- 138 просмотров
1

ответ
Python

+2 ещё

Средний
Как правильно принимать платежи пользователей в сети Tron?
- 1 подписчик
- 03 сент.
- 230 просмотров
3

ответа
Показать ещё Загружается…

C++ / Qt Разработчик

Алабуга • Екатеринбург

от 127 500 ₽

Разработчик JavaScript/NodeJS, специалист технической поддержки

A-Parser

от 600 до 800 $

Инженер по инцидентам информационной безопасности

SMALL

от 3 400 до 4 700 $

Добрый день, Вы говорите про Google, Yandex или про какой-то еще поисковик?
uwini: здравствуйте, я говорю про baidu - это китайский поисковик

Answer 1 · 2016-01-11 14:49:47

декомпозируйте

1) добиться от гугла прямой ссылки
2) выкачать по ссылке сайт

по (2) делайте отдельный, или см. например Вопрос опытным Python'щикам и Scrapy'рам (Scrapy или Grablib вам нужен), ну или wget, см. например Как скраулерить webarchive?

по (1) см. https://addons.mozilla.org/en-US/firefox/addon/goo...
можете или расковырять, или сами исследовать возвращаемое и обработать регекспами

Answer 2 · 2016-01-11 15:46:02

99.99% это AJAX, т.е. JavaScript делает HTTP-запросы.
Их можно перехватить сниффером, например, Fiddler. И сделать такие же запросы на своем ЯП.

P.S.
В 00.01% случаев это не HTTP/HTTPS, а другой протокол. Например, на сокетах возможно. Тогда HTTP-сниффер не годен.
Но это КРАЙНЕ редко бывает.

Answer 3 · 2016-01-12 13:34:47

Добрый день.

Tirend: Я говорю про baidu - это китайский поисковик.

Да там ссылки с редиректом, вида:

www.baidu.com/link?url=BG93Jq_BObOnCzspyHAmb_UtfnV...

Вы можете получить прямую ссылку из этого url, с помощю, напимер, curl или, если Вы используете php, можно это сделать только на php.

Как отдаются ссылки поисковиком?

Войдите, чтобы написать ответ

Минуточку внимания

Войдите на сайт