Нужно различать является ли набор символов словом, для это задачи стал использовать библиотеку pymorphy2. Но почему-то любой набор английских букв она помечает как слова (score = 1).
Вот сам скрипт:
threshold = 0.95
p = morph.parse(series)
score = p[0].score
print(score)
if score >= threshold:
return 'word'
else:
return 'not word'
Я знаю, что можно выбрать язык предварительно установив для этого язык и скачав для него словарь. И отсюда возник вопрос, какой язык стоит там по дефолту, и если английский то что не так в моем скрипте.
Обновлено
Увидел, что там используется в качестве базового русский язык, можно ли как то поставить английский.