Есть текстовые записи (mediumtext), размерами 1-100 кб, количество записей - 100к-1м.
Требуется найти записи со схожестью более 90% для последующего их объединения. В php есть функция similar_text(), которая на 100% соответствует задаче. Есть ли подобное в mySQL? Soundex и Levenshtein не подходит. Очень бы хотелось что-то наподобии:
SELECT id, SIMILAR_TEXT( 'проверяемый текст', str ) AS perc
FROM table
HAVING perc > 90