Задать вопрос
@alexh7854

Что использовать для подсчета слов в больших текстах?

Здравствуйте.

Есть такая задача:

Нужно обрабатывать большие тексты, а именно книги.
Необходимо реализовать подсчет слов, предложений, сколько раз используется каждое слово в книге.

Это будет веб-сайт / сервис на php.

Подходит ли php для этой задачи?
  • Вопрос задан
  • 205 просмотров
Подписаться 1 Простой 1 комментарий
Помогут разобраться в теме Все курсы
  • Skillfactory
    Профессия Fullstack веб-разработчик на JavaScript и PHP
    20 месяцев
    Далее
  • Хекслет
    PHP-разработчик
    10 месяцев
    Далее
  • Нетология
    Веб-разработчик с нуля: профессия с выбором специализации
    14 месяцев
    Далее
Пригласить эксперта
Ответы на вопрос 2
mosesfender
@mosesfender
Меланхолик, параноик, падал с коек
Что угодно подходит. Строка (текст) - это массив символов. Пили его, руби как хочешь, и считай.
Ответ написан
@pfg21
ex-турист
для слов есть алгоритм прям в вики MapReduce, раздробить по количеству вычислительных возможностей и юзать.
сравнение слов классически по хешу, причем посдчет также раздробить внутри мапредуса можно. ну и не забыть нормализацию Е-Ё И-Й

подсчет совпадающих предложений бессмыслен, ибо таковых не найдется.
Ответ написан
Комментировать
Ваш ответ на вопрос

Войдите, чтобы написать ответ

Похожие вопросы