@burov0798
Пытаюсь изучать php\js

Почему некоторые сайты парсятся без указания www., а не которые нет?

Cтоит задача спарсить текст с сайтов, загружаю сайт через curl, и некоторые сайты не парсятся, если указать так:
https://test.com/

А некоторые наоборот, только так парсятся. Как быть? Все незагруженные сайты откдывать, и потом прогонять их так:
https://www.test.com
  • Вопрос задан
  • 128 просмотров
Решения вопроса 3
SagePtr
@SagePtr
Еда - это святое
C www это отдельный поддомен, который отличается от домена. Некоторые его настраивают как алиас и в обоих случаях отдают один и тот же контент. Некоторые - вообще не добавляют, и сайт с www не открывается. А некоторые - ставят редирект, причем по-разному бывает - иногда с поддомена редиректят на домен, а иногда и наоборот.
Ответ написан
Комментировать
DevMan
@DevMan
потому что надо сказать курлу ходить по редиректам.
Ответ написан
Комментировать
vabka
@vabka
Токсичный шарпист
Ну вот так настроены эти сайты.
www не является чем-то особенным- это всё ещё часть домена, как m, qna, или career.

Решается это тем, что указывается полный URI, а не часть
Ответ написан
Комментировать
Пригласить эксперта
Ваш ответ на вопрос

Войдите, чтобы написать ответ

Войти через центр авторизации
Похожие вопросы