Это что-то типа прокси, в самом простом варианте, даже без кеширования. Т.е. каждый раз, когда кто-то заходит на сайт клон, данные запрашиваются с сайта оригинала.
Для выявления, можно обратится к клону на выдуманный url и смотреть в логах apache/nginx своего сайта, кто попробует на такой же выдуманный url зайти к вам.
Бан со стандартными ошибками может обходится автоматически через прокси.
Распространенная практика для борьбы с клоном отдавать ему какой-то бред вместо контента. Только надо аккуратно вычислять его IP, чтобы не отдать бред поисковым системам.