Как построить базовые частотные списки, используя стоп-листы?

Question

anya_hacker @anya_hacker

Python

Как построить базовые частотные списки, используя стоп-листы?

Здравствуйте. Скажу сразу как есть. Есть задание, условие которого не понятно:

Взять тексты двух похожих тематик (кино и сериалы).
1) Построить базовые частотные списки с использованием стандартного стоп-листа.
2) Посмотреть на результаты, скорректировать стоп-листы.
3) Снова построить частотные списки, сравнить результаты.

Я не прошу решение, прошу объяснить что требуется в задании. Что значит частотные списки? У меня есть стоп-лист, в котором есть слова. Частотный список - это список, в котором указано количество стоп-слов в данном тексте?
И что значит "скорректировать" стоп-листы? Добавить туда слова, которые ранее не встречались?
Вопросы могут быть глупыми, не совсем поняла что от меня требуют.

Вопрос задан более трёх лет назад
60 просмотров

Комментировать

Подписаться 1 Простой Комментировать

Помогут разобраться в теме Все курсы

Нетология

Python-разработчик: расширенный курс + нейросети

12 месяцев

Далее
Академия Эдюсон

Python-разработчик + ИИ

9 месяцев

Далее
ProductStar × РБК

Профессия: Python-разработчик + ИИ

8 месяцев

Далее

Решения вопроса 1

1 комментарий

Пригласить эксперта

Ваш ответ на вопрос

Войдите, чтобы написать ответ

Похожие вопросы

Python

+1 ещё

Средний
Почему не работает пример quickstart из документации GLiNKER?
- 1 подписчик
- вчера
- 69 просмотров
1

ответ
Python

Средний
Как правильно определять изменяющиеся типы полей при наследовании классов в python?
- 1 подписчик
- 17 июл.
- 86 просмотров
1

ответ
Python

+2 ещё

Простой
Можно ли полностью отказаться от vkhost в пользу VK ID для серверного приложения?
- 3 подписчика
- 14 июл.
- 293 просмотра
0

ответов
Python

+1 ещё

Простой
Почему разрывается подключение к бд на сервере?
- 1 подписчик
- 18 июн.
- 233 просмотра
1

ответ
Python

+2 ещё

Средний
Как новичку найти первые заказы на парсинг данных (Python)?
- 1 подписчик
- 17 июн.
- 647 просмотров
2

ответа
Python

+1 ещё

Сложный
Как на Python реализовать алгоритм, чтобы персонаж шёл по определенному маршруту в Genshin Impact?
- 3 подписчика
- 15 июн.
- 550 просмотров
2

ответа
Python

+1 ещё

Средний
Может кто помочь исправить код LTSM нейросети?
- 1 подписчик
- 12 июн.
- 307 просмотров
2

ответа
Python

+1 ещё

Средний
Telethon отказывается соединятся с серверами Telegram, как это обойти?
- 1 подписчик
- 10 июн.
- 563 просмотра
1

ответ
Python

+1 ещё

Простой
Почему копируется атрибут при создании нового экземпляра?
- 1 подписчик
- 08 июн.
- 227 просмотров
2

ответа
Python

+2 ещё

Простой
Как правильно настроить статические и медиафайлы на хостинге?
- 1 подписчик
- 04 июн.
- 140 просмотров
1

ответ
Показать ещё Загружается…

Answer 1 · 2021-12-05 14:46:55

Часто́тный слова́рь (или частотный список) — набор слов данного языка (или подъязыка) вместе с информацией о частоте их встречаемости.
Скорей всего надо удалить из текстов все стоп слова. к примеру вот так, а потом сделать частотный анализ вот так. Если в получившимся частотном списке будет много лишних слов: междометия, предлоги... значит наш стоп-лист их не обрабатывает, и их надо добавить туда

Как построить базовые частотные списки, используя стоп-листы?

Войдите, чтобы написать ответ

Минуточку внимания

Войдите на сайт