Смотрел. там как раз понятно как обучать, потому что есть обучающая выборка, где каждое предложение ассоциировано со своим классом. А я спрашиваю, что делать, если обучающей выборки как таковой нет?
Дело не в понижении размерности, с этим справляется word2vec. Нужно сделать результирующий текста. Получать его простым сложением - не самый лучший вариант. Поэтому используют cnn. Только не понятно как именно