Какие существуют способы получения canonical url при парсинге конкретного адреса ресурса?

Question

d'Ivan @2ord

Какие существуют способы получения canonical url при парсинге конкретного адреса ресурса?

Некоторому "пауку" скармливается URL некоторого адреса ресурса, допустим, _http_://www.example.com/blog/2019/mega-article
Кроме всего, потенциально возможны разные варианты URL:
_https_://www.example.com/blog/2019/mega-article
_http_://m.example.com/blog/2019/mega-article

Если в заголовке присутствует rel=canonical, то все понятно: просто извлекаем тот URL и все.
А как быть если не указан rel=canonical ?
Существуют ли другие способы получения канонического URL? А если нужно все равно его получить, то как выкрутиться из положения?

Дополнение:

описание задачи

Есть одна задача, в которой API сервис должен получить url в качестве параметра, а ответом должен вернуть

ID representing the canonical URL of the given url

Загвоздка в том как получить канонический URL если rel=canonical отсутствует. Насколько я понимаю, тогда остается принимать исходный url за канонический. Так?

Вопрос задан более трёх лет назад
125 просмотров

Комментировать

Подписаться 1 Простой Комментировать

Помогут разобраться в теме Все курсы

Яндекс Практикум

Профессиональная вёрстка на HTML и CSS

3 месяца

Далее
Stepik

Основы HTML и CSS

2 недели

Далее
Бруноям

Вёрстка на HTML и CSS

3 месяца

Далее

Решения вопроса 1

2 комментария

Пригласить эксперта

Ответы на вопрос 1

1 комментарий

Ваш ответ на вопрос

Войдите, чтобы написать ответ

Похожие вопросы

JavaScript

+2 ещё

Средний
Как можно реализовать что то вроде селекта внутри родителя у которого есть скрытые элементы и должна быть горизонтальная прокрутка?
- 1 подписчик
- 11 дек.
- 155 просмотров
0

ответов
Парсинг

Простой
Видит ли администрация сайта сканирование,и можно ли скрыть?
- 1 подписчик
- 07 дек.
- 394 просмотра
2

ответа
Поисковая оптимизация

Простой
Как вывести сайт из SEO песочницы (sandbox)?
- 1 подписчик
- 06 дек.
- 111 просмотров
2

ответа
JavaScript

+2 ещё

Простой
Как сделать резкое переключение слайдов?
- 1 подписчик
- 03 дек.
- 176 просмотров
0

ответов
Парсинг

Средний
Вся сложность парсинга Авито. Как это сделать правильно?
- 1 подписчик
- 26 нояб.
- 279 просмотров
1

ответ
HTML

+1 ещё

Средний
В какую сторону копать решение чтобы решить проблему с наложением?
- 1 подписчик
- 22 нояб.
- 143 просмотра
0

ответов
HTML

+1 ещё

Простой
Как растянуть вложенный блок внутри других блоков на максимальную длину, но не более чем на ширину страницы?
- 1 подписчик
- 21 нояб.
- 146 просмотров
0

ответов
Telegram

+1 ещё

Простой
Как спарсить подписчиков своего телеграм канала?
- 1 подписчик
- 20 нояб.
- 579 просмотров
2

ответа
Поисковая оптимизация

+1 ещё

Простой
Почему сбросились подтверждения права в Google Search Console?
- 1 подписчик
- 17 нояб.
- 102 просмотра
3

ответа
Веб-разработка

+1 ещё

Простой
Каким образом правильно сделать скрипт?
- 2 подписчика
- 15 нояб.
- 407 просмотров
2

ответа
Показать ещё Загружается…

WordPress (PHP, HTML/CSS) разработчик

Epiic

от 90 000 ₽

Frontend-разработчик (Vanilla JS, high-load media platform)

Karma8

от 200 000 до 300 000 ₽

Frontend разработчик React / Next.js

PurpleSchool

До 65 000 ₽

Answer 1 · 2019-04-10 10:52:33

Не могли бы вы переформулировать вопрос или дописать, с какой целью вам это нужно?
Сейчас вопрос звучит как "как получить канонический url, если его нет в коде?"
Если на странице нет каноникла на другой урл, значит данная страница по-умолчанию каноническая.

Answer 2 · 2019-04-10 04:36:14

ну а как вы выкрутитесь, если он может быть в общем-то каким угодно, если не указан. и для чего лично вам нужен каноникал стороннего сайта? это сугубо проблемы этого сайта, а не ваши.

Какие существуют способы получения canonical url при парсинге конкретного адреса ресурса?

Войдите, чтобы написать ответ

Минуточку внимания

Войдите на сайт