Ответы пользователя klirichek по тегу «MySQL»

Задать вопрос

Ответы пользователя по тегу MySQL

Как сгенерировать sphinx индекс программно?

klirichek @klirichek

Можно сделать так, чтобы своя программа генерила xml либо csv/tsv - и скормить получившийся поток сфинксу (через pipe).

Ответ написан более трёх лет назад

Комментировать

Комментировать
Размещение MySQL + Sphinx + отдача файлов

klirichek @klirichek

В сфинксе io-нагрузка в основном при старте/ротации индекса. А при поиске словарь и атрибуты лежат в памяти, с диска идёт обращение на чтение только к файлам spd/spp (случайное)

Ответ написан более трёх лет назад

Комментировать

Комментировать
Как найти вхождения сотен поисковых фраз в большом тексте (PHP, MySQL)?

klirichek @klirichek

В принципе, можно попробовать сделать в один проход.
Для каждой фразы делаем ДКА состояний - чтоб ловить поступающие слова и двигать состояние вперёд, если совпадает с ожидающим следующим словом. Если слова закончились - запоминать найденную позицию и сбрасывать состояние. Если новое слово не совпадает - просто сбрасывать состояние.
А дальше - организуем "игру в лото". Проходимся один раз по тексту от начала до конца и "объявляем" всем участвующим ДКА каждое слово. В конце залезаем в них и получаем списки "выигравших" позиций для каждой фразы.
Это в общем. А дальше можно оптимизировать - например, сравнивать не слова, а хэшики от них.
И не "объявлять" каждому "игроку" каждое слово, а собирать у них множество ожидаемых ими хэшиков - и если текущий попадает в множество - двигать состояния у "выигравших", а у всех остальных - сбрасывать.
Ещё шаг - сделать не одно, а два множества. В одном - хэшики тех, что в начальном состоянии (при сбросе они не меняются -> не нужно читать значения заново). Во втором - "играющие".

Здесь нужно побенчить по сравнению с indexof. Последний внутри себя, конечно, будет работать быстрее, чем аналогичный "самописный", однако на определённых параметрах (совокупность размера входного текста вместе с количеством и размером искомых фраз) уже может вполне его обойти за счёт меньшей сложности.

Ответ написан более трёх лет назад

Комментировать

Комментировать

Самые активные сегодня

Drno
- 2 ответа
- 0 вопросов
Zerg89
- 2 ответа
- 0 вопросов
VoidVolker
- 2 ответа
- 0 вопросов
Сергей Соколов
- 1 ответ
- 1 вопрос
Сергей Горностаев
- 1 ответ
- 0 вопросов
ilezovofficial
- 0 ответов
- 1 вопрос

Как сгенерировать sphinx индекс программно?

Размещение MySQL + Sphinx + отдача файлов

Как найти вхождения сотен поисковых фраз в большом тексте (PHP, MySQL)?

Войдите на сайт