Здесь буду собирать ссылки на вероятностные алгоритмы:
1. Фильтр блума
https://ru.wikipedia.org/wiki/%D0%A4%D0%B8%D0%BB%D...
2. MinHash
habrahabr.ru/post/115147
3. LogLog: находим число уникальных элементов --
habrahabr.ru/post/119852
3.1 HyperLogLog
4. Поиск похожих документов с MinHash + LHS:
habrahabr.ru/post/250673
5.
https://en.wikipedia.org/wiki/Count%E2%80%93min_sketch -- приближенный сбор частот событий в потоке.
6. Алгоритм Рабина — Карпа: поиск подстрок в строке через хеширование.
https://ru.wikipedia.org/wiki/%D0%90%D0%BB%D0%B3%D...
https://en.wikipedia.org/wiki/Category:Probabilist...