Latent Dirichlet Allocation. Step by step tutorial?
Хотелось бы найти годные статьи, объясняющие не только саму модель, ее принципы, но и показывающие, как и что делать, в каком порядке, куда какие данные передавать, как использовать полученные результаты. Большинство источников нужную информацию пропускают, а без нее работа стопорится. Под нужной информацией имею ввиду то, откуда брать переменные alpha, beta, темы, словари, порядок обработки данных, интерпретация результатов. Если все таки мои догадки верны и темы и слова тем вычисляются из входных данных в процессе работы алгоритма, то хотелось бы найти ресурс, в котором объясняется, что брать, куда передавать, как использовать полученный результат.
P.S. видел Infer.Net - не совсем то. Это готовая реализация, а мне бы все это в голове сначала представить.
Я как то тоже искал, не нашел. LDA похож на plsa, возможно он тебе подойдет для начала, если еще не пробовал. Пишут что там точность чуть ниже, но попробовать можно. Довольно понятно написан plsa на С https://github.com/JFantasy/plsa. На c# переписывается легко.