Определить язык строки, чуток не дотягивает до определения языка сайта. Я понимаю что можно взять какой то кусок из страницы и определить его язык. Но сайт на много больше чем строка. И может получится что вырезанная строка окажется на одном языке, а большинство других текстов на другом.
Но если не получится найти что-то готовое. Придётся брать например title или h1 и определять их язык, и на основе делать выводы. Но хотелось бы что-то более узконаправленное именно на сайты.