Как лучше всего сделать поиск по сайту?

Question

Игорь Мясников @pilium

Веб-разработка

Как лучше всего сделать поиск по сайту?

Здравствуйте. Как сейчас лучше всего сделать поиск по небольшому сайту? Сайт не посажен ни на одну CMS

Вопрос задан более трёх лет назад
946 просмотров

Комментировать

Подписаться 7 Простой Комментировать

Помогут разобраться в теме Все курсы

Нетология

Веб-разработчик с нуля: профессия с выбором специализации

14 месяцев

Далее
Академия Эдюсон

Веб-разработчик Базовый

9 месяцев

Далее
ProductStar × РБК

Профессия: Web-разработчик + ИИ

8 месяцев

Далее

Решения вопроса 1

Комментировать

Пригласить эксперта

Ответы на вопрос 3

6 комментариев

Комментировать

Ваш ответ на вопрос

Войдите, чтобы написать ответ

Похожие вопросы

Веб-разработка

+1 ещё

Средний
Почему после запроса RSS Хабр перестаёт принимать соединения с IP?
- 1 подписчик
- час назад
- 7 просмотров
0

ответов
Веб-разработка

+2 ещё

Средний
Как создавать нормальный B2B SaaS? Есть ли какие то ру курсы/литература? Насколько углубленные знания языка программирования должны быть?
- 1 подписчик
- 13 часов назад
- 70 просмотров
2

ответа
Веб-разработка

+4 ещё

Простой
Как хранить публичный медиа-контент сайта?
- 1 подписчик
- 03 июл.
- 254 просмотра
3

ответа
Веб-разработка

Простой
В какой программе/сайте можно создать и выгрузить html сайт?
- 3 подписчика
- 21 июн.
- 902 просмотра
3

ответа
Веб-разработка

+2 ещё

Средний
Как избежать вездесущего agentic coding и остаться в IT?
- 8 подписчиков
- 01 июн.
- 3755 просмотров
12

ответов
Веб-разработка

+2 ещё

Средний
Как правильно хранить видео в Django?
- 2 подписчика
- 28 мая
- 468 просмотров
3

ответа
Веб-разработка

Простой
Какую панель для хостинга выбрать в моём случае?
- 2 подписчика
- 25 мая
- 514 просмотров
6

ответов
Веб-разработка

+1 ещё

Средний
Изоляция сетевого слоя (WebSockets/Fetch) в Web Worker для высоконагруженного UI: используют ли такой паттерн в реальном проде?
- 1 подписчик
- 24 мая
- 231 просмотр
4

ответа
Веб-разработка

+1 ещё

Средний
Safari помечает легитимный сайт как мошеннический. Google clean, Apple не отвечает. У кого был похожий опыт?
- 2 подписчика
- 22 мая
- 254 просмотра
2

ответа
Веб-разработка

+2 ещё

Сложный
Сайт висит при первом заходе на него. Как такое исправить?
- 3 подписчика
- 20 мая
- 1184 просмотра
4

ответа
Показать ещё Загружается…

Answer 1 · 2018-08-24 11:31:10

Михаил Лялин @mr_jok

поисковые формы от Яндекс, Гугл, DuckDuckGo для поиска по сайту

Ответ написан более трёх лет назад

Комментировать

Answer 2 · 2018-08-24 10:15:37

rubtsoff @rubtsoff

я бы посоветовал поисковик от гугла: https://cse.google.ru/cse

Ответ написан более трёх лет назад

6 комментариев

Answer 3 · 2018-08-24 13:25:48

1. Форма для отправки. Поле ввода и кнопка (минимальное).

2. Обработка POST или GET в внешней программе (процессе) . Процесс открывает и слушает. Обрабатывает и возврашает на страницу что нашол. У меня ушел один вечер на WEB сервер, этот просто.

3. Робот.
--- Содержимое сайта чем то парсить и делать базу слов и выражений.

4. Дерево тегов (как старорежимный тематический каталог)
--- Набрать по тексту набор тегов. Желательно в виде дерева. Если сайт наполняете не вы, можно добавить метку "страница обновлена" (для робота) и пользователю интерфейс добавить ключи поиска в дерево.
--- Можно прикрутить самообучалку (если позволяет задача).
--- Можно эту базу выдавать в виде *.html

*Кремний
**Поликристал <--- ссылка на список страниц.
***импортный <- тоже ссылка...
***очистка
**Кусковой
**Техинческий
*Германий

Такое дерево реализуется ссылками например в каталогах или БД (лучше всего своей, живущей в GPU).
Открыв "кремний поликристал" попадет в каталог с "импортный" и "очистка". Дальше может быть ссылка на адрес и метка в странице или переход на эту же страницу с параметром для скрипта "перейди на ??? строчку и выдели ??? текст".

5. "Каталог мне не нравится, хочу искать сам". - после капчи (или ее аналога) запускается парсер файлов.
Вариант 1:

("кремний кусковой")and(ГОСТ)

-- просто написать чтото вроде "GREP" но умнее, как старый Яндекс и Гугл.
Вариант 2:
Можно упростить жизнь в виде:

[x]Точное совпадение   
  настройки: [х]-Учет регистра. [2]-растояние между словами. <more>
  [x]:[Кремний кусковой]  
  [ ][ <null> ]
[  ]Точное совпадение   
[x]Должны быть в документе слова (фразы) на растоянии от искомого 
  настройки: [х]-Учет регистра. [4]-слов.  [any]-символов.    <more - спойлер>
  [x][в наличии]
  [  ][ null ]
[ ]Должны быть в документе слова  на растоянии от искомого.
[ ]Дата изменения документа.

Реализуется как:

условия_поиска {
  uchar ucType; <-- enum { .. }
  параметры_для_словия xOpt;
  char* pszText; 
};

Запустить поток (и). Открыть документ из списка публичных файлов (как usermap у samba или exports.conf у nfs) .
Пробежаться по массиву проверяя выполнение этих условий. Если все верно, запомнить места и добавить в выдачу.

Если сделать в виде отдельной проги будет полезна и вне вашего продукта (или искать, возможно такая уже есть).
Тогда просто скармливать ей из списка публичных файлов файлы и смотреть выдачу.

Можно и к grep прикрутить обработку, кому как нравится (как поиск по манам).

Answer 4 · 2018-08-24 09:19:09

Dimonchik @dimonchik2013

non progredi est regredi

postgresql
sphinx

в общем-то и в Мускуле есть Full text search

Ответ написан более трёх лет назад

Комментировать

Как лучше всего сделать поиск по сайту?

Войдите, чтобы написать ответ

Минуточку внимания

Войдите на сайт