Проблема с utf8_general_ci

Question

Александр Белов @IPRIT

MySQL

Проблема с utf8_general_ci

В таблице содержатся поля: name, author и другие.
name и author — FULLTEXT индексы.
Делаю поиск по этим полям. Вот мой запрос:

SELECT *, MATCH (`name`, `author`) AGAINST ('+моя_строка' IN BOOLEAN MODE) as REL
FROM `editions`
WHERE MATCH (`name`, `author`) AGAINST ('+моя_строка' IN BOOLEAN MODE)
ORDER BY REL DESC
LIMIT 0, 10

Все работает и исполняется, но теперь встает вопрос: как сделать такой же вариант, но проигнорировав регистр? (Ответ "Хранить в полях name и author данные в нижнем регистре" не принимается)

Вопрос задан более трёх лет назад
3135 просмотров

Комментировать

Подписаться 2 Оценить Комментировать

Помогут разобраться в теме Все курсы

Stepik

PRO C#. Базы данных

2 месяца

Далее
Академия Эдюсон

Python-разработчик + ИИ

9 месяцев

Далее
ProductStar × РБК

Профессия: Java-разработчик + ИИ

9 месяцев

Далее

Решения вопроса 2

5 комментариев

Комментировать

Пригласить эксперта

Ваш ответ на вопрос

Войдите, чтобы написать ответ

Похожие вопросы

MySQL

Простой
Странное поведение COALESCE в SQL запросе?
- 1 подписчик
- 15 мая
- 126 просмотров
1

ответ
MySQL

+2 ещё

Простой
Как исправить ошибку could not load file or assembly «System.Data.SqlClient»?
- 1 подписчик
- 06 мая
- 101 просмотр
1

ответ
MySQL

+1 ещё

Простой
Как поднять контейнер mysql через wsl?
- 1 подписчик
- 21 мар.
- 362 просмотра
2

ответа
MySQL

+1 ещё

Простой
Как удалить число содержащееся в ячейке таблицы бд Mysql среди чисел через запятую, если таких чисел 2 или более удалить только первое найденое?
- 1 подписчик
- 19 февр.
- 245 просмотров
1

ответ
MySQL

Простой
Выдаёт ошибку #1062 — Дублирующаяся запись '??????' по ключу 'PRIMARY', как исправить?
- 1 подписчик
- 16 февр.
- 214 просмотров
2

ответа
MySQL

Простой
Как оптимизировать или создать правильно mysql запрос?
- 1 подписчик
- 11 февр.
- 223 просмотра
2

ответа
PHP

+1 ещё

Простой
Как получить 3 массива из одного запроса?
- 2 подписчика
- 01 февр.
- 315 просмотров
4

ответа
MySQL

+1 ещё

Простой
Почему не работает кастомное поле в CDR?
- 1 подписчик
- 20 янв.
- 166 просмотров
1

ответ
MySQL

+2 ещё

Средний
Как определить, необходимую версию tomcat и mysql?
- 1 подписчик
- 07 янв.
- 220 просмотров
1

ответ
MySQL

Средний
Почему время в mysql опережает на пару секунд?
- 4 подписчика
- 06 янв.
- 447 просмотров
4

ответа
Показать ещё Загружается…

Answer 1 · 2014-01-08 15:42:40

Использовать case-insensitive collation для `name` и `author`.
Добавил здесь
Collation: uft8_unicode_ci

SELECT `name`, 
    MATCH(`name`) AGAINST ('+Пупкин' IN BOOLEAN MODE) AS REL1, 
    MATCH(`name`) AGAINST ('+пупкин' IN BOOLEAN MODE) AS REL2, 
    MATCH(`name`) AGAINST ('+ПУПКИН' IN BOOLEAN MODE) AS REL3, 
    MATCH(`name`) AGAINST ('+пУПКИН' IN BOOLEAN MODE) AS REL4
FROM `test`;

Получаем:

+-----------------+--------------------+--------------------+--------------------+--------------------+
|     `name`      |       `REL1`       |       `REL2`       |       `REL3`       |       `REL4`       |
+-----------------+--------------------+--------------------+--------------------+--------------------+
| 'Вася Пупкин'   | 0.0906190574169159 | 0.0906190574169159 | 0.0906190574169159 | 0.0906190574169159 |
| 'вася пупкин'   | 0.0906190574169159 | 0.0906190574169159 | 0.0906190574169159 | 0.0906190574169159 |
| 'Дуся Пупкина'  | 0                  | 0                  | 0                  | 0                  |
| 'Маша Люськина' | 0                  | 0                  | 0                  | 0                  |
+-----------------+--------------------+--------------------+--------------------+--------------------+

То есть релевантность не зависит от регистра.

Answer 2 · 2014-01-11 02:06:53

Для тех, кто столкнулся с такой же проблемой — вот мое решение:
По умолчанию character_set_server устанавливается сервером как latin1, если не изменить в конфиге БД. Если у вас нет доступа к редактированию конфига, то после соединения с БД в вашем скрипте, делайте следующие SQL-запросы:

SET CHARACTER SET utf8
SET NAMES utf8

За место utf8 можете поставить подходящую вам кодировку.
После этих строк utf8_general_ci прекрасно работает, соответственно, включается регистронезависимый поиск по строке для оператора LIKE или конструкции MATCH AGAINST.

Проблема с utf8_general_ci

Войдите, чтобы написать ответ

Минуточку внимания

Войдите на сайт