Пытался проанализировать русские комментарии с помощью NLTK’s Pre-Trained Sentiment Analyzer и наткнулся на ошибку с кодировкой. У меня есть и английские комментарии и такая же ошибка. Кто подскажет как исправить?
Код:
nltk.download('vader_lexicon')
def is_positive(comment: str) -> bool:
"""True if comment has positive compound sentiment, False otherwise."""
return sia.polarity_scores(comment)["compound"] > 0
for comment in russiancomments[:10]:
print(">", is_positive(comment), comment)
Скриншот ошибки: