@alexh7854

Что использовать для подсчета слов в больших текстах?

Здравствуйте.

Есть такая задача:

Нужно обрабатывать большие тексты, а именно книги.
Необходимо реализовать подсчет слов, предложений, сколько раз используется каждое слово в книге.

Это будет веб-сайт / сервис на php.

Подходит ли php для этой задачи?
  • Вопрос задан
  • 203 просмотра
Пригласить эксперта
Ответы на вопрос 2
mosesfender
@mosesfender
Меланхолик, параноик, падал с коек
Что угодно подходит. Строка (текст) - это массив символов. Пили его, руби как хочешь, и считай.
Ответ написан
@pfg21
ex-турист
для слов есть алгоритм прям в вики MapReduce, раздробить по количеству вычислительных возможностей и юзать.
сравнение слов классически по хешу, причем посдчет также раздробить внутри мапредуса можно. ну и не забыть нормализацию Е-Ё И-Й

подсчет совпадающих предложений бессмыслен, ибо таковых не найдется.
Ответ написан
Комментировать
Ваш ответ на вопрос

Войдите, чтобы написать ответ

Похожие вопросы