Как проиндексировать коллекцию со строками на разных языках?

Question

lssssssssssl @lssssssssssl

Как проиндексировать коллекцию со строками на разных языках?

Допустим, есть коллекция User. Есть у него поле name. У одного пользователя name: 'Vasya', а у второго name: ' Вася'.
Ставлю индекс text на поле name и монго ругается.
Что можно придумать?

Индекс нужен, чтобы можно было искать совпадения по символам
Можно,конечно, для этого воспользоваться $regex, чтобы искать совпадения по символам, но не думаю, что это будет быстро в долгосрочной перспективе.

Вопрос задан более трёх лет назад
103 просмотра

4 комментария

Подписаться 3 Простой 4 комментария

lssssssssssl @lssssssssssl Автор вопроса

ChairfaceChippendale, Index build failed. Collection test.words caused by :: language override unsupported: ko' on server
На корейский язык ругается. Там поля 50 на 50 английский\корейский и нужно что-то с этим сделать. В то же время, корейский язык по алфавиту бд сортирует без проблем, значит понимает :)

Написано более трёх лет назад
lssssssssssl @lssssssssssl Автор вопроса
ChairfaceChippendale, Там разные слова на корейском и разные на английском, которые друг с другом никак не связаны. лежат они в одной коллекции под одним ключом, например:

[ { foo: 'hello', bar: 'some info', baz: 'lala', }, { foo: 'дерево', bar: 'some info', baz: 'lalalaaa' }, { foo: '클라우드', bar: 'some info', baz: 'lalalo' }, ]

Например, придёт в запрос "де", надо найти все совпадения с "де" в foo и вытащить. Придёт hel, надо также найти все совпадения с hel в foo

Завтра туда может ещё какой-то язык добавится. надо придумать, либо как это быстро можно достать, ежели коллекция эта будет гигантская очень, либо придумать, как это разрезать на более мелкие коллекции, если такое возможно.
Написано более трёх лет назад
nowm @nowm

А не может быть проблема в том, что у вас в каком-то документе в этой коллекции язык указан не ko, а ko' — с одинарной кавычкой? Просто у вас в тексте ошибки есть ko с кавычкой, а монго вроде в таком сообщении не должна вставлять никаких одинарных кавычек.

Написано более трёх лет назад
lssssssssssl @lssssssssssl Автор вопроса

nowm, На самом деле там вторая ковычка в начале текста ошибки, просто я её упустил
Command failed with error 17262 (Location17262): 'Index build failed: 6a9ce3f0-442b-44f2-a95f-da008be55e00: Collection test.words ( 7899c4bf-0a6c-4f5f-a9ad-9f979d5df104 ) :: caused by :: language override unsupported: ko' on server

Написано более трёх лет назад

Помогут разобраться в теме Все курсы

Нетология

DevOps-инженер с нуля

15 месяцев

Далее
Академия Эдюсон

Python-разработчик + ИИ

9 месяцев

Далее
ProductStar × РБК

Профессия: Python-разработчик + ИИ

8 месяцев

Далее

Пригласить эксперта

Ваш ответ на вопрос

Войдите, чтобы написать ответ

Похожие вопросы

Базы данных

Средний
В чем разница между логической и физической модели в БД?
- 1 подписчик
- 27 мая
- 309 просмотров
3

ответа
Базы данных

Простой
Как решить проблему когда две запущенные транзакции изменяют одну и ту же строку, но одна из транзакций видит старые данные а не новые?
- 1 подписчик
- 28 мар.
- 297 просмотров
3

ответа
Базы данных

Простой
Когда использовать рекурсивное удаление?
- 1 подписчик
- 10 мар.
- 173 просмотра
2

ответа
Базы данных

+1 ещё

Простой
Где взять актуальный список городов в странах с таймзонами на русском?
- 1 подписчик
- 21 дек. 2025
- 170 просмотров
1

ответ
MongoDB

Простой
Как получить записей содержащих нужное значение в массиве?
- 1 подписчик
- 18 дек. 2025
- 79 просмотров
1

ответ
Базы данных

Простой
Как настроить десятки связей и не потеряться в модели (prisma orm)?
- 1 подписчик
- 10 нояб. 2025
- 120 просмотров
0

ответов
PostgreSQL

+1 ещё

Простой
Как вести историю работы с записями во всех таблицах для всех пользователей?
- 2 подписчика
- 08 нояб. 2025
- 307 просмотров
2

ответа
Базы данных

+1 ещё

Средний
Какие методы синхронизации SQL Express и MSSQL Server порекомендуете?
- 3 подписчика
- 03 нояб. 2025
- 244 просмотра
1

ответ
Базы данных

+1 ещё

Простой
Как правильно реализовать обновление порядка (поле order) в бд?
- 1 подписчик
- 19 окт. 2025
- 251 просмотр
2

ответа
SQL

+1 ещё

Простой
Как сделать уменьшение склада в СУБД безопасными правильным?
- 2 подписчика
- 14 окт. 2025
- 285 просмотров
4

ответа
Показать ещё Загружается…

ChairfaceChippendale, Index build failed. Collection test.words caused by :: language override unsupported: ko' on server
На корейский язык ругается. Там поля 50 на 50 английский\корейский и нужно что-то с этим сделать. В то же время, корейский язык по алфавиту бд сортирует без проблем, значит понимает :)
ChairfaceChippendale, Там разные слова на корейском и разные на английском, которые друг с другом никак не связаны. лежат они в одной коллекции под одним ключом, например:

[ { foo: 'hello', bar: 'some info', baz: 'lala', }, { foo: 'дерево', bar: 'some info', baz: 'lalalaaa' }, { foo: '클라우드', bar: 'some info', baz: 'lalalo' }, ]

Например, придёт в запрос "де", надо найти все совпадения с "де" в foo и вытащить. Придёт hel, надо также найти все совпадения с hel в foo

Завтра туда может ещё какой-то язык добавится. надо придумать, либо как это быстро можно достать, ежели коллекция эта будет гигантская очень, либо придумать, как это разрезать на более мелкие коллекции, если такое возможно.
А не может быть проблема в том, что у вас в каком-то документе в этой коллекции язык указан не ko, а ko' — с одинарной кавычкой? Просто у вас в тексте ошибки есть ko с кавычкой, а монго вроде в таком сообщении не должна вставлять никаких одинарных кавычек.
nowm, На самом деле там вторая ковычка в начале текста ошибки, просто я её упустил
Command failed with error 17262 (Location17262): 'Index build failed: 6a9ce3f0-442b-44f2-a95f-da008be55e00: Collection test.words ( 7899c4bf-0a6c-4f5f-a9ad-9f979d5df104 ) :: caused by :: language override unsupported: ko' on server

Как проиндексировать коллекцию со строками на разных языках?

Войдите, чтобы написать ответ

Минуточку внимания

Войдите на сайт