Доброго всем дня. Прошу совета, может быть кто то решал уже подобную задачу?
Стоит задача: необходимо иметь информацию, какие сайты и страницы в сети посещают пользователи? Ключевым является тот факт, что смотреть нужно не только сайты, но и страницы на этих сайтах.
Пример.
https://qna.habr.com/
https://www.google.com/
https://www.opennet.ru/
Вот это руководителя не устраивает. А вот...
Утилита для слежения за активностью пользователей в windows
https://www.google.com/search?q=nDPI&oq=nDPI&aqs=e...
https://www.opennet.ru/prog/info/3752.shtml
устраивает.
Что для этого сделано: подняты CentOS7, squid, sarg. В squid.conf добавлен параметр "strip_query_terms off".
В итоге далеко не все сайты имеют полный url. Как пример.
1627440748.901 86682 192.168.0.168 TCP_TUNNEL/200 6102 CONNECT azwcus1-client-s.gateway.messenger.live.com:443 - HIER_DIRECT/52.159.49.199 -
1627440748.955 0 192.168.0.194 TCP_MEM_HIT/200 4833 GET http://tile-service.weather.microsoft.com/ru-RU/livetile/preinstall? - HIER_NONE/- text/xml
1627440749.198 10025 192.168.0.200 TCP_TUNNEL/200 5775 CONNECT cdn01.nativeroll.tv:443 - HIER_DIRECT/92.223.99.99 -
1627440749.421 2843 192.168.0.200 TCP_TUNNEL/200 4711 CONNECT moe.video:443 - HIER_DIRECT/92.223.103.64 -
1627440749.515 3892 192.168.0.200 TCP_TUNNEL/200 4711 CONNECT moe.video:443 - HIER_DIRECT/92.223.103.64 -
Что то мне подсказывает, что это связано с https, но боюсь моих знаний не хватает, что бы понять, как это реализовывать правильно?
Буду очень признателен если ткнёте носом, что я делаю не так, или покажете направление в котором нужно копать?