Вопросы вместо русских букв SphinxSearch 2.0.2

Question

propovednik @propovednik

Вопросы вместо русских букв SphinxSearch 2.0.2

У меня есть полностью utf-ная mysql база, с utf табличками и utf полями.
Вот что в SHOW VARIABLES:

character set client utf8

character set connection utf8

character set database utf8

character set results utf8

character set server utf8

character set system utf8

collation connection utf8_general_ci

collation database utf8_general_ci

collation server utf8_general_ci

В конфиге sphinx:

sql_query_pre = SET NAMES utf8

sql_query_pre = SET CHARACTER SET utf8

В секции index'a конфига sphinx (charset_table — дефолтная из мануала для charset_type utf-8):

charset_type = utf-8

charset_table = 0..9, A..Z->a..z, _, a..z, U+410..U+42F->U+430..U+44F, U+430..U+44F

Но даже с учетом всего этого в результатах поиска вопросы вместо русских символов.
При этом если сделать xml файлики и получать данные через xmlpipe2, то ищет как надо и русские символы показывает, то есть скорее всего данные от базы уже приходят с вопросами.
Не подскажите ли, где и что я еще мог забыть?

Вопрос задан более трёх лет назад
5172 просмотра

1 комментарий

Подписаться 5 Оценить 1 комментарий

Помогут разобраться в теме Все курсы

Нетология

1C-программист: расширенный курс

18 месяцев

Далее
Академия Эдюсон

Python-разработчик + ИИ

9 месяцев

Далее
ProductStar × РБК

Профессия DevOps-инженер + ИИ

5 месяцев

Далее

Пригласить эксперта

Ответы на вопрос 3

1 комментарий

Комментировать

Ваш ответ на вопрос

Войдите, чтобы написать ответ

Похожие вопросы

PHP

+1 ещё

Простой
Как работать с Manticore Search на php?
- 1 подписчик
- 29 апр.
- 187 просмотров
1

ответ
Sphinx

Простой
Возможно ли настроить wordforms в Manticore с добавлением нескольких синонимов к указанному слову, а не только один?
- 1 подписчик
- 06 окт. 2025
- 96 просмотров
1

ответ
Sphinx

+1 ещё

Простой
Не ставится Sphinx в виртуальной машине Bitrix 7.5.5?
- 1 подписчик
- 14 авг. 2025
- 74 просмотра
0

ответов
Sphinx

Средний
Как указать --skip-ssl в конфиге manticore?
- 3 подписчика
- более года назад
- 375 просмотров
1

ответ
JavaScript

+4 ещё

Сложный
Почему в WebSockets History в Burp Suite отображаются кракозябры?
- 1 подписчик
- более года назад
- 247 просмотров
2

ответа
Linux

+2 ещё

Простой
Как установить Sphinx на Alma Linux 9?
- 1 подписчик
- более года назад
- 183 просмотра
4

ответа
C#

+1 ещё

Средний
Что делать когда при конвертации из utf8 в string я получаю (string)\0\0\0 и так далее?
- 1 подписчик
- более года назад
- 154 просмотра
1

ответ
PHP

+1 ещё

Средний
Как заставить sphinxsearch 3.6.1 выводить несколько полей?
- 1 подписчик
- более года назад
- 108 просмотров
2

ответа
1С-Битрикс

+1 ещё

Сложный
Как сделать чтобы sphinx выдавал сперва точные совпадения а потом остальные?
- 1 подписчик
- более года назад
- 212 просмотров
1

ответ
Python

+2 ещё

Простой
Почему хранимая процедура MySQL не принимает кириллицу?
- 3 подписчика
- более года назад
- 181 просмотр
1

ответ
Показать ещё Загружается…

Всем спасибо, разобрался. Как выяснилось, даже при выставленных везде и всюду utf, данные сфинкс получает все равно в какой-то другой, видимо latin1 кодировке. Помогло SET NAMES 'utf8' (именно с кавычками). Теперь замечательно работаю с дополнительными данными, а не только с ID документов, таким образом для поиска вообще не трогаю базу данных.

Answer 1 · 2012-01-16 11:16:40

Аркадий @p0is0n

У вас сфинкс возвращает текстовые данные?

Ответ написан более трёх лет назад

1 комментарий

Answer 2 · 2012-01-16 11:28:47

Сфинкс должен возвращать только id документов, а результаты поиска по ним вы должны сами генерировать.
В принципе, для использования сфинкса через консоль он позволяет также выводить какую-то информацию в качестве результата запроса, но это только для тестов и доступно только через консоль.

Когда вы начнете использовать сфинкс в своем проекте — вам придется работать с id документов, и соответственно сфинкс не будет возвращать никаких букв, ни русских, ни английских.

Answer 3 · 2015-06-25 16:37:30

А как возврат сниппетов? Здесь одним id не обойтись.
В файле my.ini (для MySQL) в любых параметрах не должно быть иной кодировки кроме как utf-8.
Обрежь также права пользователя БД (есть такой прикол).

Вопросы вместо русских букв SphinxSearch 2.0.2

Войдите, чтобы написать ответ

Минуточку внимания

Войдите на сайт