на счет оптимально не знаю, но для учета последовательностей можно использовать в той же модели байеса еще и последовательности, биграмы триграмы и т.д.
из более изощренных методов, можно взять лингвиста и выделить ряд фич типа «положительное-прилагательное существительное», или более конкретные фичи «автор ты негативное-прилагательное» =) ну и т.д. набрать штук 50 фич для начала. затем обучить линейную регрессию каким либо алгоритмом обучения.
из этих же фичь можно сделать обучающее множество для какого нибудь алгоритма оптимизации, допустим для нейросетки, и обучить эту модель
вообще используя такие фичи можно учитывать как раз разговорные словоформы и отношения между словами
из более изощренных методов, можно взять лингвиста и выделить ряд фич типа «положительное-прилагательное существительное», или более конкретные фичи «автор ты негативное-прилагательное» =) ну и т.д. набрать штук 50 фич для начала. затем обучить линейную регрессию каким либо алгоритмом обучения.
из этих же фичь можно сделать обучающее множество для какого нибудь алгоритма оптимизации, допустим для нейросетки, и обучить эту модель
вообще используя такие фичи можно учитывать как раз разговорные словоформы и отношения между словами