Задать вопрос

Как выбрать строки по проценту схожести в mysql?

Есть текстовые записи (mediumtext), размерами 1-100 кб, количество записей - 100к-1м.

Требуется найти записи со схожестью более 90% для последующего их объединения. В php есть функция similar_text(), которая на 100% соответствует задаче. Есть ли подобное в mySQL? Soundex и Levenshtein не подходит. Очень бы хотелось что-то наподобии:

SELECT id, SIMILAR_TEXT( 'проверяемый текст', str ) AS perc
FROM table
HAVING perc > 90
  • Вопрос задан
  • 1493 просмотра
Подписаться 3 Оценить Комментировать
Ответ пользователя slinkinone К ответам на вопрос (3)
slinkinone
@slinkinone
Агент "Везде успеть"
Мне кажется вам стоит написать свою хранимую функцию и реализовать в ней алгоритм, который заложен в similar_text.
php.net/manual/ru/function.similar-text.php - здесь указано название алгоритма, который лежит в основе данной функции.
Ответ написан
Комментировать