@Svoboo

Как отобрать наиболее часто встречаемые строки в файле?

Есть файл порядка 10кк строк, требуется выбрать топ-50 строк, которые встречаются наиболее часто. На чем такое проще реализовать и как?
  • Вопрос задан
  • 203 просмотра
Пригласить эксперта
Ответы на вопрос 1
xSkyFoXx
@xSkyFoXx
  • Открываете любой скриптовый язык, который знаете.
  • Делаете элементарный препроцессинг: всё приводите к нижнему регистру, убираете знаки препинания и т.п.
  • Разбиваете всё на пары ключ: значение ("слово": 1, "другое": 1).
  • Группируете по ключу. Функция группировки значений - сумма.
Ответ написан
Комментировать
Ваш ответ на вопрос

Войдите, чтобы написать ответ

Войти через центр авторизации
Похожие вопросы