такого нет и быть не может, если знаешь, КАК работают регулярки, хоть ДКА, хоть НКА
только корпус и поиск по нему
единственное - можешь всунуть корпус в фильтр Блума, но для Блума есть ложноположительные
но корпус только слов - небольшой (Если не заморачиваться с именами собственными): буквально 10-15 тыс (если Лев Толстой - 40-50) - так что задача вполне решаема