преимущество в размерах, фильтр Блума может иметь массив бит произвольного размера, предложенное же Вами решение будет иметь массив бит напрямую зависящий от размерности хэша, например для crc32 понадобится 512МБ
Это очень много для структуры, которая не говорит ни о чем кроме наличия
1 отсутвие неопределенности, но коллизии также остаются
раз коллизии остаются, то неопределенность все же есть
2 более высокая битовая плотность 1 к 1
это вообще как относится к решаемой задаче?
3 расчет только одной хэш функции
расчет 10-15 хэшей будет быстрее чем расчет одного + чтение с диска с произвольным доступом. И да, читать битмап придется с диска, ибо столько оперативы под решаемую задачу не даст ни один админ