Как на сайте отделить динамический контент от статической структуры?
Собственно пишу парсер. Вернее пока размышляю на этот счет. Статическая часть сайта это хеадер, сайдбар, футер, возможно баннеры и бредкрамбс (трудность в том что ШТМЛЬ этих частей сайта может менять на разных страницах). Динамическая часть это контент, изменяющийся от страницы к странице и собственно представляющая главную ценность страницы. Надо отделить статическую структуру сайта от динамического конента
взять любые две страницы с любого сайта и сравнить html, все, что не совпадает по цепочкам тэгов, и будет динамическим контентом
я так понимаю, что масштабы воровства контента принимают нереальные AI размеры
Андрей Прозоров, это вы так думаете, но вряд ли вы консультировались с юристами
на самом деле вы обязаны спрашивать и получать разрешение на публикацию
и при этом совершенно не важно, что вы делаете
если на ресурсе указано, что перепечатка запрещена, или если вы игнорируете robot.txt, то вы нарушаете закон