Ответы, понравившиеся пользователю Константин

Задать вопрос

Лайки

Какой программой или сервисом сравнения слов и словосочетаний можно воспользоваться для сравнения большого объема данных?

xmoonlight @xmoonlight
https://sitecoder.blogspot.com

Написать алгоритм нечеткого поиска самому или использовать существующие.

Попробуйте составить хеши так:
Пример: Познавательное
Hash: онаепзвтль:14
[по-порядку максимально часто встречающийся символ][и т.д. из оставшихся]:[общее кол-во символов]

Ввод: познаватильное
hash: онапзвтилье:14
При несовпадении - отодвигаете влево на 1 символ на каждой итерации:
1. онаепзвтль:14 == онапзвтилье:14 - не найдено
2. онаепзвтль == онапзвтилье - не найдено
3. онаепзвтл == онапзвтиль- не найдено
....
N. она == она - НАЙДЕНО (кроме этого может быть еще что-то найдено).
Смотрим из результатов самые близкие по кол-ву символов. В примере: к 14-и.
Выводим первые N-совпадений... Например, первые 5 похожих...

Ответ написан более трёх лет назад

Комментировать

Комментировать

Самые активные сегодня

Пума Тайланд
- 2 ответа
- 0 вопросов
Zerg89
- 1 ответ
- 0 вопросов
vlada723
- 0 ответов
- 1 вопрос
YuuutsunaRyu
- 0 ответов
- 1 вопрос
Dhwtj
- 1 ответ
- 0 вопросов
moralex1993
- 0 ответов
- 1 вопрос

Какой программой или сервисом сравнения слов и словосочетаний можно воспользоваться для сравнения большого объема данных?

Войдите на сайт