Очень легко открыть
www.dhl.ru (или
https://www.dhl.ru) в браузере. (Дальше он там кинет редирект на другой сайт, но это уже не имеет значения).
Но если сделать
curl http://www.dhl.ru/
- то ничего не будет (просто "висит", пока не нажмешь Ctrl-C):
xenon@pi:/tmp $ curl https://www.dhl.ru/
^C
То же самое с www.dhl.com
Наверное, это защита от ботов, скрапинга - все ок, понимаю. Но как она работает? Я пробовал заменить User-Agent и другие хидеры, пробовал --http2, в общем, мне кажется, попробовал почти полностью "представиться" настоящим человеческим браузером и ничего не помогает.
Практической ценности в задаче нет, случайно на это наткнулся, но очень хочется понять, как это сделано и как это можно обойти (curl, wget, python requests итд)?