Как правильно искать совпадение по словам в php?

Question

Сергей Нижний Новгород @Terras

Как правильно искать совпадение по словам в php?

Всем привет

Есть большой архив переписки с клиентами. Задача автоматически сегментировать далоги, собрать эмоциональный окрас диалогов (все хорошо, проблема, продажи, конкуренты итд). Т.е. фактически прогнать все диалоги на наличие каких-то ключевых слов. Как это правильно сделать, чтобы не сильно проседать по скорости работы?

p.s. либо есть смысл уже использовать дерево с помощью python big data?

Вопрос задан более трёх лет назад
342 просмотра

2 комментария

Подписаться 1 Средний 2 комментария

Помогут разобраться в теме Все курсы

Нетология

Веб-разработчик с нуля: профессия с выбором специализации

14 месяцев

Далее
Stepik

PHP (pro)

2 недели

Далее
Хекслет

PHP-разработчик

10 месяцев

Далее

Пригласить эксперта

Ответы на вопрос 3

Комментировать

Ваш ответ на вопрос

Войдите, чтобы написать ответ

Похожие вопросы

Карьера в IT

+1 ещё

Средний
Хочу попробовать стать системным аналитиком, с чего лучше начать и во сколько попытаться найти работу?
- 4 подписчика
- 25 июн.
- 788 просмотров
6

ответов
PHP

Средний
Как сделать что бы переменная avatar($ank['id']); не конфликтовала с другим файлом?
- 1 подписчик
- 17 июн.
- 190 просмотров
2

ответа
PHP

+2 ещё

Средний
Как решить проблему с smtp сервером?
- 1 подписчик
- 03 июн.
- 422 просмотра
1

ответ
Информационная безопасность

+3 ещё

Простой
Утечка кейвордов в Телеграм при посещении постороннего сайта?
- 3 подписчика
- 03 июн.
- 297 просмотров
3

ответа
PHP

Средний
Как составить регулярное выражение?
- 1 подписчик
- 31 мая
- 239 просмотров
2

ответа
IT-образование

+2 ещё

Средний
Бизнес и системный аналитик: кто это?
- 2 подписчика
- 29 мая
- 385 просмотров
3

ответа
PHP

+2 ещё

Простой
Как настроить php_curl для php8 под windows?
- 1 подписчик
- 28 мая
- 186 просмотров
3

ответа
PHP

Простой
При правильном вводе каптчи не прегистрируется как исправить?
- 1 подписчик
- 24 мая
- 152 просмотра
2

ответа
JavaScript

+2 ещё

Средний
Стоит ли переносить логику работающего онлайн-калькулятора с JS на PHP ради защиты формул от копирования?
- 3 подписчика
- 18 мая
- 2456 просмотров
8

ответов
PHP

+1 ещё

Простой
Как получить список файлов из локальной папки?
- 1 подписчик
- 11 мая
- 321 просмотр
6

ответов
Показать ещё Загружается…

The V's of Big Data: Velocity, Volume, Value, Variety, and Veracity. ... In order to make sense out of this overwhelming amount of data it is often broken down using five V's: Velocity, Volume, Value, Variety, and Veracity

Просьба не указывать бигдату в суе
А большой это сколько?

Просто прогонами ключевых слов получите много ошибок. (но тут конечно зависит от ваших требований)
- Есть ли проблемы? Все хорошо?
- Больших проблем нет, но тревожат продажи конкурентов.

Answer 1 · 2018-10-10 11:48:18

Иван Шумов @inoise Куратор тега PHP

Solution Architect, AWS Certified, Serverless

Либо прочитать, например, про Elastic Search или Sphinx

Ответ написан более трёх лет назад

Комментировать

Answer 2 · 2018-10-10 11:50:50

Вряд ли есть необходимость брать весь диалог, из-за возможности встречающихся ключевых слов в процессе разговора, не относящихся к сути обращения.
Имеет смысл взять только первое сообщение от клиента, в котором он излагал суть обращения. А значит сократить объем обрабатываемых данных. Если нет, то не сильно это усложнит обработку, если обрабатывать все сообщения, даже если их миллионы - Это же одиночная обработка. Дальше вы будуте обрабатывать новые входящие обращения на лету. Значит:
1. Выбрать первые сообщения всех диалогов из БД. (можно с использованием limit и пометкой после обработки, что этот диалог уже обработан).
2. Циклом пробегаетесь по всем полученным данным. Внутри цикла foreach с массивом ключевых слов а внутри foreach функция stripos(). если есть совпадение с ключевым словом - кидаем в массив совпадений ID диалога и ID ключевого слова.
3. После прохождения всех диалогов. Записываете в отдельную таблицу ID диалогов и ключевых слов одним запросом.

Далее все новые вопросы обрабатываете таким же способом. А список диалогов получаете так же как и получали, но уже с использованием JOINа к новой таблице, чтобы вывести соответствующие пометки

Answer 3 · 2018-10-10 12:01:35

Дмитрий @dmtrrr

Backend developer

NLP

Ответ написан более трёх лет назад

Комментировать

Как правильно искать совпадение по словам в php?

Войдите, чтобы написать ответ

Минуточку внимания

Войдите на сайт