Часто́тный слова́рь (или частотный список) — набор слов данного языка (или подъязыка) вместе с информацией о частоте их встречаемости.
Скорей всего надо удалить из текстов все стоп слова. к примеру
вот так, а потом сделать частотный анализ
вот так. Если в получившимся частотном списке будет много лишних слов: междометия, предлоги... значит наш стоп-лист их не обрабатывает, и их надо добавить туда