Задать вопрос

artymail

Артем @artymail

oracle

Как использовать русскую морфологию в Oracle Text (в СУБД 11g R2)?

Приветствую, коллеги.

В официальной документации к Oracle Text 11g Release 2 (11.2) (ссылка) сказано о том, что русская морфология поддерживается на уровне словооснов (stemmer). Попробовал это на практике:

Таблица:

select * from docs;
 
        ID TEXT
---------- --------------------
         1 читать
         2 читаю
         3 читал
         4 чтение
         5 sing
         6 sang
         7 singing
         8 sung

Создаем лексер:

exec ctx_ddl.create_preference('MYLEXER', 'world_lexer');

Создаем индекс:

create index i_docs on docs (text) indextype is ctxsys.context
   parameters ('LEXER MYLEXER stoplist CTXSYS.EMPTY_STOPLIST');

Далее запрос на английский текст выдает правильный результат (4 записи):

SELECT SCORE ( 1 ), text
  FROM docs
  WHERE CONTAINS (text, '$sing', 1 ) > 0
  ORDER BY SCORE ( 1 ) DESC;

А запрос на русский текст выдает только одну запись:

SELECT SCORE ( 1 ), text
  FROM docs
  WHERE CONTAINS (text, '$читать', 1 ) > 0
  ORDER BY SCORE ( 1 ) DESC;

На форуме sql.ru прочитал, что возможно виновата исходная кодировка самого инстанса. Мои параметры:

NLS_CHARACTERSET     CL8ISO8859P5
NLS_NCHAR_CHARACTERSET    AL16UTF16

Пробовал на 12-й версии СУБД (на UTF8 в 12.1.0.2), результат тот же.

Кто-нибудь сталкивался с подобной задачей? Удалось ли подключить русскую морфологию?

Вопрос задан более трёх лет назад
846 просмотров

Комментировать

Подписаться 1 Оценить Комментировать

Помогут разобраться в теме Все курсы

Учебный центр IBS

DB-021 Язык Oracle PL/SQL для разработчиков

1 неделя

Далее
Stepik

SQL для начинающих: с нуля до сертификата Oracle

2 недели

Далее
OTUS

SQL для разработчиков и аналитиков

3 месяца

Далее

Пригласить эксперта

Ваш ответ на вопрос

Войдите, чтобы написать ответ

Похожие вопросы

Виртуализация

+2 ещё

Средний
Запуск двух виртуальных машин. Как правильно?
- 1 подписчик
- 12 нояб.
- 347 просмотров
3

ответа
Oracle

Простой
Почему вложеность запроса так сильно меняет скорость?
- 1 подписчик
- 08 авг.
- 391 просмотр
1

ответ
Автоматизация обработки текста

Простой
Существует ли инструмент (система) автоматизации форматирования текста в docx по предопределенным правилам?
- 2 подписчика
- 05 авг.
- 183 просмотра
2

ответа
SQL Server

+2 ещё

Простой
Как создать связанный Oracle сервер с Ms SQL server?
- 1 подписчик
- 05 июн.
- 132 просмотра
0

ответов
SQL

+1 ещё

Простой
Как найти нужные столбцы в таблице oracle по содержанию?
- 2 подписчика
- 04 июн.
- 134 просмотра
1

ответ
Oracle

Простой
Можно ли устанавливать oracle 11g2 сразу из «патчсета»?
- 1 подписчик
- 30 мая
- 58 просмотров
0

ответов
Zabbix

+1 ещё

Простой
В шаблоне Заббикса Oracle by Zabbix agent 2?
- 1 подписчик
- 28 апр.
- 105 просмотров
0

ответов
Нейронные сети

+1 ещё

Средний
Как автоматически создавать большие отчёты из множества docx файлов?
- 2 подписчика
- 18 апр.
- 457 просмотров
4

ответа
Oracle

Простой
Как пронумировать строки в группе?
- 1 подписчик
- 04 апр.
- 67 просмотров
2

ответа
Git

+3 ещё

Простой
Как оптимально переносить состояние таблиц и объектов PL/SQL из БД в Git?
- 3 подписчика
- 19 мар.
- 464 просмотра
3

ответа
Показать ещё Загружается…

Principal Recruitment • Москва

от 200 000 до 250 000 ₽

DevOps Инженер

Principal Recruitment • Москва

от 200 000 до 350 000 ₽

Principal Recruitment • Москва

от 200 000 до 350 000 ₽