Очевидно, что нужен комплексный подход - использование нескольких методов и комбинирование их результатов.
На первом этапе проверка просто по словарю - есть ли такие слова, затем можно проверять есть ли существительное, есть ли прилагательное, в общем морфология, синтаксис и пунктуация.
Словарей должно быть два - один общий, а другой является базой всех отправлений через сервис (используемые сокращения и жаргон попадёт в него).
Логично будет договориться с другой крупной транспортной компанией и приобрести у них базу описаний отправлений.
На втором этапе статистический подход - распределение букв по клавиатуре, длина и количество слов, насколько слова похожи на слова (приставки, слоги, окончания). Здесь же можно посчитать количество информации (энтропию) описания и сравнить её со средним значением.
И на третьем этапе - помощь интернета, поиск описания на яндекс маркете, amazon, ebay и прочем.
Каждый этап выставляет свой балл и затем они комбинируются с коэффициентами в результирующий балл.