Масса вариантов. Берете кучу книг в txt, натравливаете на них скрипт на питоне в 20 строк, он из текстов формирует словарь. Можно написать скриптец, который будет по заданным правилам слова генерить.
Нужно использовать нормальную реализацию хэша и использовать ее правильно. MD5 не содержит никаких элементов случайности и хэш для одинаковых данных должен быть одинаковым.