Как (с помощью чего) лучше организовать анализ текста?

Question

Олег Кулаков @Morphine43

Техник АСУП

Как (с помощью чего) лучше организовать анализ текста?

Условно: Есть система, которая генерит таски для хелпдеска автоматически. Техники, после исправления, описывают причины и действия на таск в произвольной форме. Суть - необходимо группировать описания техников по причинам возникновения сбоя, т.е. брать их комментарии, искать в них причину сбоя и группировать таким образом, чтобы при след. возникновении сбоя была бы доступна инфо по наиболее популярным причинам. Вопрос - в какую сторону копать для реализации этого функционала (нейросети? деревья решений? хэш-таблицы? другие умные слова? просто парсить по "белому списку ключевиков"?). Есть ли решения для реализации этого (типа Java Hadoop для нейросетей или Python Numpy для мат. анализа). Инструменты не принципиальны, но пока представляется Web реализация либо на C/C++ либо Java на бэкенде и (не принципиально чем) Angularjs во фронте.

Вопрос задан более трёх лет назад
569 просмотров

6 комментариев

Подписаться 5 Оценить 6 комментариев

DS28 @DS28

А может техникам предоставить основные теги? Пусть помечают причину в рамках той классификации которая вам нужна?

Написано более трёх лет назад
sim3x @sim3x

Даня: без модерации - в теги будут совать бред и в итоге они стану бесполезны

Написано более трёх лет назад
sim3x @sim3x

А у вас есть знания и ресурсы, что реализовать
умные слова
?

Написано более трёх лет назад
DS28 @DS28

sim3x: может влияние на техников дешевле выйдет? Прописать в обязанности, если пойдут косяки - штрафовать?

Написано более трёх лет назад
sim3x @sim3x

Даня: может и проще

Я, лично, за сфинкс + обратная положительная связь с выдачей после анализа работы оператора

Написано более трёх лет назад
Олег Кулаков @Morphine43 Автор вопроса

Если влиять на техников то знаний не появиться)))) время не критично, так что есть возможность поразбираться и сделать красоту, опять же в резюме не плохим плюсом будет

Написано более трёх лет назад

Помогут разобраться в теме Все курсы

Нетология

Аналитик данных: расширенный курс

11 месяцев

Далее
Skillfactory

Data Scientist с нуля до PRO

25 месяцев

Далее
Яндекс Практикум

Аналитик данных

7 месяцев

Далее

Пригласить эксперта

Ответы на вопрос 3

Комментировать

Ваш ответ на вопрос

Войдите, чтобы написать ответ

Похожие вопросы

Хранение данных

+1 ещё

Сложный
Как сделать Service Structure рабочими в Tempo?
- 1 подписчик
- 06 нояб.
- 40 просмотров
0

ответов
Аналитика

Простой
Где посмотреть примеры оформления кода для экономического анализа данных?
- 1 подписчик
- 11 сент.
- 238 просмотров
2

ответа
Аналитика

+1 ещё

Простой
Какие есть эффективные средства анализа больших данных?
- 2 подписчика
- 20 авг.
- 193 просмотра
3

ответа
Алгоритмы

+1 ещё

Средний
Как можно предиктить дату регистрации при массиве данных?
- 1 подписчик
- 03 июл.
- 181 просмотр
1

ответ
Аналитика

+1 ещё

Средний
Как быстро локализовать в логах источник изменений метрики?
- 1 подписчик
- 30 июн.
- 104 просмотра
0

ответов
Математика

+3 ещё

Средний
Как выбрать размеры интервалов для неравно интервального вариационного ряда?
- 1 подписчик
- 24 июн.
- 180 просмотров
2

ответа
Аналитика

Простой
Какие сейчас используются качественные программы для pairwise?
- 2 подписчика
- 04 мая
- 65 просмотров
2

ответа
Аналитика

+1 ещё

Простой
Если ли более изящный способ вычисления суммы максимальных значений за день в ретроспективе 1 месяц?
- 5 подписчиков
- 21 мар.
- 2257 просмотров
2

ответа
Аналитика

+1 ещё

Средний
Как построить объясняющую модель временного ряда?
- 2 подписчика
- 08 февр.
- 182 просмотра
0

ответов
Аналитика

Простой
Какой самый мощный сервис статистики для сайта?
- 1 подписчик
- 07 янв.
- 150 просмотров
2

ответа
Показать ещё Загружается…

Reverse engineer

Brain Shells

от 3 000 до 5 000 $

Продуктовый аналитик

Outlines Tech • Москва

До 280 000 ₽

Аналитик

SLLR.market

от 180 000 до 250 000 ₽

А может техникам предоставить основные теги? Пусть помечают причину в рамках той классификации которая вам нужна?
Даня: без модерации - в теги будут совать бред и в итоге они стану бесполезны
А у вас есть знания и ресурсы, что реализовать
умные слова
?
sim3x: может влияние на техников дешевле выйдет? Прописать в обязанности, если пойдут косяки - штрафовать?
Даня: может и проще

Я, лично, за сфинкс + обратная положительная связь с выдачей после анализа работы оператора
Если влиять на техников то знаний не появиться)))) время не критично, так что есть возможность поразбираться и сделать красоту, опять же в резюме не плохим плюсом будет

Answer 1 · 2017-06-25 09:32:59

нужно копать в сторону sphinx.
Нейросети скорее всего не помогут либо помогут при гораздо более высоких усилиях и ресурсах.
Сфинкс - некое подобие Яндекс/гугл. Сначала индексирует материал, потом по поисковой фразе выдаст результаты отсортированные по релевантности.

Answer 2 · 2017-06-25 10:10:52

Извлечение объектов и фактов из текстов в Яндексе. (видео-лекция)
Что такое Томита-парсер, как Яндекс с его помощью ...

Answer 3 · 2017-06-25 14:20:50

основа для возрата ответов - Сфинкс, ну или Эластик
а вот с запросом к нему - нужно заморочиться с СИСТЕМОЙ
система должна , помимо основного вопроса, возвращать его синонимы ( чтобы по ним параллельно запрашивать Сфинкс, основная проблема поиска - не вернуть релевантный ответ, а понять что хочет спросить пользователь)
тут - от Томиты и NLTK до кластеризации и ручных таблиц синонимов

Как (с помощью чего) лучше организовать анализ текста?

Войдите, чтобы написать ответ

Минуточку внимания

Войдите на сайт