Исходные данные: более 200 000 текстовых обращений пользователей в ИТ-поддержку компании за 2017г.
Задача\проблема: текущая классификация обращений слишком верхнеуровневая. Как следствие невозможно детально проанализировать проблемы пользователей. Необходимо пере классифицировать обращения по отдельному списку классификаций т.е. сопоставить конкретное обращение с новой категорией. Оценить точность.
Рассматривал много вариантов машинного обучения и остановился на Keras и Python. Много примеров, но непонятны следующие вопросы:
- Как, практически, выводятся результаты работы нейросети? Под результатом я понимаю уже готовый список обращений с новой классификацией.
- Как, учитывая мою задачу, построить процесс обучения нейросети? Предполагаю, что должен быть некий интерфейс где я буду указывать к примеру "у меня не работает иксель" должен относится к категории Excel.
Буду признателен за вашу помощь в ответах. Так же может у кого ни будь есть практические примеры реализации похожей задачи?