ru-RU вместо просто ru
не приведёт ли это к каким-либо санкциям со стороны поисковика
не будет ли каких-либо глюков при индексации страницы в которой интерфейс на одном языке, а статья на другом
ssh akamajoris@host2
rsync -avz --delete foo/ akamajoris@host2:~/projects/foo/
rsync -avz --delete akamajoris@host2:~/projects/foo/ foo/
Ну так это про определение языка контента, а не про вес страницы. Ладно, допустим гугл не определит правильно язык страниц, где интерфейс и контент на разных языках. К чему это приведёт? Страница может быть понижена в рейтинге с учётом языка выдачи. То есть:
/ru/article/25 — контент ru
/en/article/25 — контент ru
/fr/article/25 — контент ru
две последние получат пониженный вес. НО(!), с учётом того, что они и так содержат дубликат контента, — они скорее всего будут выкинуты из выдачи вообще. То есть, их как бы нет. Ваша задача теперь в том, чтобы объяснить поисковику, что нужная страница — это /ru/article/25.
Я на самом деле не знаю, как они относятся к смешанному содержимому, да и никто не знает, у ранжирования куча критериев, которые знает только гугл.
Я бы предложил не вносить дубликаты страниц в sitemap, а сам непереведённый контент на дубликатах страниц, помещать в noindex либо подгружать скриптом.
.
Я не про интерфейс. Я про соответствие /ru/articles/25 и китайского языка в контенте. Ок, я согласен, пусть ссылка будет /cn/articles/25, меню на русском (по accept-language), но контент должен быть на китайском. И это правильно, потому что ссылками иногда делятся. Если китаец поделится ссылкой /ru/articles/25 для своих китайцев, туда станут приходить китайцы, а потом вы переведёте статью, и язык станет русским — они немного не поймут, почему так. Поэтому ссылка должна быть сразу /cn/. То есть, китайский контент должен быть только по ссылке /cn/*, а русский — только по /ru/*. Аутентичность.