PSQL отрезает концовки некоторых слов в to_tsvector, что делать?

Question

Krokochik @Krokochik

PostgreSQL

PSQL отрезает концовки некоторых слов в to_tsvector, что делать?

PSQL отрезает концовки некоторых слов в to_tsvector.

У меня есть леммы, я хочу искать по ним:

кот сделать дело (id: 28)
дело сделать кот наконец то (id: 29)

но запрос

SELECT id
FROM pst
WHERE to_tsvector("title") @@ plainto_tsquery('наконец')
ORDER BY ts_rank(to_tsvector("title"), plainto_tsquery('наконец')) DESC;

ничего не отдает. Как я выяснил:

SELECT to_tsvector("title") 
FROM pst 
WHERE pst.id = 28;
-----
'дел':3 'кот':1 'сдела':2
-----
SELECT to_tsvector("title") 
FROM pst post
WHERE post.id = 29;
-----
'дел':1 'кот':3 'сдела':2

Я пробовал поставить в to_tsvector поставить как regconfig другой язык, но в этом случае не работал поиск через ts_query. Подскажите, что можно сделать?

Вопрос задан более двух лет назад
148 просмотров

Комментировать

Подписаться 3 Средний Комментировать

Решения вопроса 1

Комментировать

Пригласить эксперта

Ваш ответ на вопрос

Войдите, чтобы написать ответ

Похожие вопросы

Linux

+2 ещё

Простой
Postgres Docker: Странные временные файлы в папке overlay2?
- 1 подписчик
- 23 июл.
- 161 просмотр
0

ответов
PostgreSQL

Простой
Почему не удается авторизоваться под юзером postgres?
- 1 подписчик
- 22 июл.
- 87 просмотров
3

ответа
PostgreSQL

Простой
Как подружить анализатор PostgreSQL со своим составным типом?
- 2 подписчика
- 19 июл.
- 1257 просмотров
1

ответ
PostgreSQL

Простой
Как отсортировать дни рождения от ближайшего?
- 1 подписчик
- 16 июл.
- 136 просмотров
1

ответ
PostgreSQL

Простой
Как понять почему размер БД вырос на 30%?
- 5 подписчиков
- 14 июл.
- 3330 просмотров
2

ответа
PHP

+1 ещё

Простой
Как получить id добавленной записи PHP PDO PGSQL?
- 1 подписчик
- 01 июл.
- 226 просмотров
1

ответ
PostgreSQL

Средний
В чем может быть причина сброса значения sequence в БД?
- 1 подписчик
- 23 июн.
- 151 просмотр
1

ответ
PostgreSQL

Простой
Как обнаружить все битые таблицы?
- 1 подписчик
- 12 июн.
- 186 просмотров
1

ответ
Linux

+3 ещё

Простой
Вылеты 1с без ошибок на дебиане, как исправить?
- 1 подписчик
- 10 июн.
- 261 просмотр
2

ответа
PostgreSQL

Простой
Нормально ли дублирование строк в IN?
- 1 подписчик
- 19 мая
- 237 просмотров
3

ответа
Показать ещё Загружается…

Администратор баз данных PostgreSQL

Bell Integrator • Москва

DBA Postgresql

Outlines Tech • Москва

До 300 000 ₽

Администратор прикладного ПО (PostgreSQL)

Гринатом

Answer 1 · 2022-12-17 11:23:18

melkij=> SELECT * from ts_debug('russian', 'дело сделать кот наконец то');
 alias |    description    |  token  |  dictionaries  |  dictionary  | lexemes 
-------+-------------------+---------+----------------+--------------+---------
 word  | Word, all letters | дело    | {russian_stem} | russian_stem | {дел}
 blank | Space symbols     |         | {}             |              | 
 word  | Word, all letters | сделать | {russian_stem} | russian_stem | {сдела}
 blank | Space symbols     |         | {}             |              | 
 word  | Word, all letters | кот     | {russian_stem} | russian_stem | {кот}
 blank | Space symbols     |         | {}             |              | 
 word  | Word, all letters | наконец | {russian_stem} | russian_stem | {}
 blank | Space symbols     |         | {}             |              | 
 word  | Word, all letters | то      | {russian_stem} | russian_stem | {}
(9 строк)

lexemes text[] — the lexeme(s) produced by the dictionary that recognized the token, or NULL if none did; an empty array ({}) means it was recognized as a stop word

https://www.postgresql.org/docs/current/textsearch...

Там же, далее:

melkij=> SELECT ts_lexize('russian_stem', 'наконец');
 ts_lexize 
-----------
 {}

ts_lexize returns an array of lexemes if the input token is known to the dictionary, or an empty array if the token is known to the dictionary but it is a stop word, or NULL if it is an unknown word.

Используемый словарь намеренно отмечает это слово как бессмысленное слово, не используемое для поиска.

Если вы с таким поведением не согласны, используйте другой словарь или делаете свой: https://www.postgresql.org/docs/current/textsearch...

PSQL отрезает концовки некоторых слов в to_tsvector, что делать?

Войдите, чтобы написать ответ

Минуточку внимания

Войдите на сайт