Я собираюсь хранить много данных для поиска по ним с помощью «расстояния хемминга».
Объем ~1 000 000. Решил использовать BK дерево, но при том-же миллионе поиск получается долгий, примерно 10-20 секунд.
Само дерево:
dumpz.org/192335/ (Cython)
Может есть другие, более быстрые алгоритмы?