В общем случае ваша задача не решается, т.к. в больших случайных данных есть ненулевая вероятность нахождения любой строки. Все зависит от данных, их формата и того, что за строки и как туда попадают.
Для выявления потенциальных строк в бинарном тексте можете посмотреть, например, утилиту
strings из GNU binutils