Как происходит индексация поисковиками несвязанных областей/файлов сайта?

Question

Genome_X @Genome_X

Поисковые системы

Как происходит индексация поисковиками несвязанных областей/файлов сайта?

Собственно — вопрос. Я пока не искушен в теме поисковиков, но хочу узнать об этом больше. Сейчас интересует следующее — как происходит индексация ресурсов сайта, которые никак не связаны между собой, т.е. на них не ведут ссылки с других страниц, они нигде не упомянаются на сайте и т.д. Как поисковик узнает где лежит тот или иной файл, если к нему не ведут никаких ссылок?

Как я это понимаю — поисковик гуляет по ссылкам, заходя в доступные ему директории, и индексирует вообще все находящиеся в ней файлы, даже те, к которым не идет никаких ссылок. Или же все-таки идет некое подключение к серверу и попытка посмотреть какие вообще там есть директории и файлы?

Как верно?

Вопрос задан более трёх лет назад
3145 просмотров

Комментировать

Подписаться 2 Оценить Комментировать

Помогут разобраться в теме Все курсы

Нетология

1C-программист: расширенный курс

18 месяцев

Далее
Академия Эдюсон

Python-разработчик + ИИ

9 месяцев

Далее
ProductStar × РБК

Профессия DevOps-инженер + ИИ

5 месяцев

Далее

Пригласить эксперта

Ответы на вопрос 6

Комментировать

4 комментария

quantum @quantum

Первая ссылка www.rozluch.com.ua/guestbook/passwd.dat, заходим в папку www.rozluch.com.ua/guestbook/ и вот ссылки на все файлы. Ну а на саму папку или ссылка проскочила, или возможно, гугл увидел папку и решил посмотреть, что в ней есть

Написано более трёх лет назад
Genome_X @Genome_X Автор вопроса

А! Т.е. все-таки делается некий листинг директории поисковиком, т.е. она открывается, и поисковик смотрит какие вообще там лежат файлы и индексирует их, верно?

Написано более трёх лет назад
quantum @quantum

Ниже уже сказали, что список файлов отдает сам сервер в виде хтмл-страницы. Для поисковика www.rozluch.com.ua/guestbook/ — это обычная страница

Написано более трёх лет назад
DevMan @DevMan

На которую скорее всего когда-то была ссылка с главной.

Написано более трёх лет назад

1 комментарий

Комментировать

Ваш ответ на вопрос

Войдите, чтобы написать ответ

Похожие вопросы

Нейронные сети

+1 ещё

Простой
Какую нейронку с API и web поиском можете посоветовать?
- 1 подписчик
- 01 мар.
- 170 просмотров
1

ответ
Поисковая оптимизация

+3 ещё

Простой
Как продвинуть сайт в поиске?
- 2 подписчика
- 25 февр.
- 705 просмотров
4

ответа
Поисковые системы

Простой
Эффективны ли программы, защищающие фото и видеофайлы от систем поиска по лицу?
- 1 подписчик
- 11 янв.
- 193 просмотра
3

ответа
Парсинг

+1 ещё

Простой
Как увеличить охват поисковых фраз Wildberries и ускорить?
- 2 подписчика
- 23 сент. 2025
- 244 просмотра
0

ответов
Поисковая оптимизация

+3 ещё

Средний
Yandex не индексирует изображения на сайте, почему?
- 2 подписчика
- более года назад
- 914 просмотров
2

ответа
Поисковая оптимизация

+2 ещё

Средний
Нужно ли как-то решать проблему в файле robots (Правило, которое не учитывается Googlebot: host)?
- 1 подписчик
- более года назад
- 337 просмотров
2

ответа
Поисковая оптимизация

+1 ещё

Простой
Улучшают ли позиции в ПС разные «оптимизаторы» текстов?
- 1 подписчик
- более года назад
- 154 просмотра
3

ответа
Поисковые системы

Простой
Как подменить домен в поисковике?
- 2 подписчика
- более года назад
- 169 просмотров
2

ответа
Поисковые системы

Простой
Какие книги посоветуете для изучение того как работает поисковая система?
- 1 подписчик
- более года назад
- 171 просмотр
1

ответ
Поисковые системы

Средний
Как найти информацию о файле?
- 1 подписчик
- более года назад
- 104 просмотра
0

ответов
Показать ещё Загружается…

Answer 1 · 2012-02-17 06:44:59

Поисковик может попасть на страницу:
— по ссылке на эту страницу
— если такая страница есть в sitemap
— сайт как-то по другому экспортирует данные в поисковик (отзывы, товары в яндексе)
— на странице стоит счетчик от поисковика (аналитикс, метрика)

Тупо перебором он не будет страницы пытаться найти

Answer 2 · 2012-02-17 07:01:25

Хм, т.е. на все это должны быть некие указатели? Т.е. если на серв положить некий файл, никак и ничем не связанный с остальным контентом, он не будет проиндексирован?
Я почему спросил, намедни смотрел через поисковик на наличие файла passwd.dat, содержащий связку логин/пароль для форм авторизации, многие поисковики выдавали приличные результаты с кучей сайтов, где был найден этот файл. Поэтому и появился вопрос, как он был найден? Не думаю что на него ведет некая ссылка с сайта. В голову приходит только мысль, что сам путь до него может содержать в каком-нибудь другом скрипте, который лежит на сайте. Но это мне представляется как-то маловероятным.

Answer 3 · 2012-02-17 07:45:00

Еще могут «стучать» всякие Google и Yandex bar-ы, когда сам обращаешься к ресурсу (на который нет ссылок) по полному пути.

Answer 4 · 2012-02-17 08:29:38

1) меню со ссылками на разделы разве нет
2) а зачем сайт, у которого нет грамотной внутренней линковки разделов

Answer 5 · 2012-02-17 08:44:59

Вопрос не про какой-то конкретный сайт, а про в общем, на которых лежат файлы типа passwd.dat, причем линков на них естественно на самом сайте нет. Больше склоняюсь к тому, что поисковик делает листинг доступной ему директории. Не знаю как это объяснить, типа команды «dir» для консоли в винде, которая оторбажает содержимое директории. Это возможно?

Answer 6 · 2012-02-17 10:03:56

Не знаю точно, но допускаю что если на сайте есть ссылка вида /dir1/dir2/dir3/, поисковики могут проверить и /dir1/dir2/dir3/ и /dir1/dir2/ и /dir1/. Таким образом, если на сервере установлен, например, apache с включенным и не настроенным как надо модулем mod_autoindex то будет выдан список файлов в этих директориях.

Как происходит индексация поисковиками несвязанных областей/файлов сайта?

Войдите, чтобы написать ответ

Минуточку внимания

Войдите на сайт