у doc/xls есть стандартный заголовок. Его наличие не гарантирует, что остальное целое, но с вероятностью 1E+12
гарантирует что там был офисный документ.
у pdf тоже есть и заговолок и маркер конца.
Тектстовые файлы проверять на попадание в диапазон текстовых и т.п. символов. Либо на отсутствие непечатных символов. Можно регистры текста проверять, но тут будет немало ложных срабатываний.
Такие варианты проверок будут самыми быстрыми, но софт придется самому делать, хотя тут делов на один вечер.