Есть контент, опубликованный на одном сайте ввиде PDF файла и тот же контент, опубликованный ввиде статьи на другом сайте.
1. Какой контент лучше индексируется?
2. Если сначала был опубликован PDF и проиндексирован поисковиками, а потом на другом сайте выложена статья с этим же контентом, есть вероятность, что статья с контентом будет лучше ранжироваться в поисковиках?
Допустим я опубликовал PDF, а сайт конкурент спёр и выложил, как статью. Есть вероятность, что его статья всплывёт выше и есть вероятность, что поисковики расценят сайт конкурента, как дубль?
Dr_Gonzo: да нет такого в выдаче. Что значит дубль? Дубль - это когда на вашем сайте дублируется информация. Тем более тут разные форматы. Поисковики будут показывать и то, и другое.
PDF хорош для всяких инструкций, которые в виде страниц сайта будут смотреться не особо круто. Ну например инструкция к холодильнику: полностью ее выкладывать на сайте со всей технической информацией бессмысленно. Но можно сделать страницу с частично выбранной полезной информацией + выложить полную инструкцию в PDF, как собственно и делают все сайты.
Ну вот я возьму и выложу инструкцию, как страницу (смотреться будет не особо круто, с другой стороны, пользователю не нужно еще кнопку нажимать для скачивания\открытия файла), взяв её с сайта производителя. Моя страница будет в выдаче выше, несмотря на то что я по сути занимаюсь плагиатом. С инструкцией еще ладно, а если это уникальный контент, опубликованный на сайте, а я его своровал и выложил...? Получается - копируй изз pdf и выкладывай ввиде страниц, т.к. ранжирование страниц лучше)))
Dr_Gonzo: Нет, это бред.
Если тебя интересует, возьмем ситуацию "в вакууме", где на ранжирование влияет только формат страницы: пдф файл и html страница. В этом случае обе страницы будут ранжироваться одинаково.
Возьмем другую ситуацию. Ты выложил пдф файл, конкурент скопировал и выложил тот же материал но в html. Ранжироваться выше будет тот, у кого быстрее проиндексируется страница. Можно предположить, что тот, кто первый выложит, тот и "победит", но, например, если у конкурента есть на сайте БР (Быстроробот, который ежедневно индексирует сайт), в таком случае победит он.
Опять же. Мы пренебрегаем тысячами факторов в этих ситуациях. Берем пример из комментария выше и предполагаем, что инструкция к холодильнику лучше выглядит и читается в пдф формате. Возможно ли, что твой даже скопипащенный текст будет выше его оригинальной html? Да. Из за поведенческих факторов например, т. к. люди будут охотнее кликать и читать на инструкцию в более удобном для них формате.
Короче говоря. Оптимизируйте для пользователей и будет всё ок.