Добрый день.
Подскажите способы для вычленения данных из текста.
Например, одна из задач - посчитать упоминание фильмов в тексте. Названия могут быть из нескольких слов, фильмы могут быть любыми.
Существует какой-то подход? Куда двигаться? Любые советы очень помогут.
Смотря какой язык текста. Если в языке падежи не влияют на словообразование (английский), то можно даже простым перебором, если тексты не сложные. Если же влияют (русский) - регулярными выражениями.