wataru, пирвретвствую - мне нужно искать вот такие строки...
"Все возможные с 1-2 ошибками" - генерировать не нужно: это заблуждение.
Нужно генерировать по опорным признакам соответствия заданной строки к искомой.
Есть ещё вариант использовать целочисленный наборный полином, но это, как-то, не айс...
дима кубитский, да не быстро это совсем... надо эвристикой решать через хешинг "сырых" данных.
Попробуй 100к записей перебери на-лету - сразу узнаешь...
дима кубитский, всё верно говорите! так оно и происходит. но для того, чтобы перебирать - нужно заранее иметь это дерево. а мне нужно - "на-лету" анализировать данные.
maagalex, банально начну с примера-вопроса: так будет проще.
Например, мне нужно захешировать слово: "простор" так, чтобы при 2-х любых ошибках ввода:
1. неверная 1 или 2 буквы
и/или
2. пропуск 1 или 2 букв
...хеш - не изменялся и оставался постоянным.
Olek1, согласен. я буду совмещать Хирагану со слогами по старым правилам и получу деление на акустические всплески. После - уже сделаю допуски по возможным ошибкам по каждому такому всплеску и захеширую через свой алфавит.
"Все возможные с 1-2 ошибками" - генерировать не нужно: это заблуждение.
Нужно генерировать по опорным признакам соответствия заданной строки к искомой.
Есть ещё вариант использовать целочисленный наборный полином, но это, как-то, не айс...