Добрый день!
Вопрос мой несколько нестандартный, на SO его отмели, как несоответствующий правилам.
Ситуация такова: я студент 4го курса, в качестве общей темы для диплома выбрал data mining, конкретнее, recommendation systems. Год назад писал на эту тему курсовую, правда, больше обзорную, чем какое-то исследование.
Собственно вопрос: в какую сторону мне лучше копать дальше? Есть желание не просто сделать диплом и забить, а, по возможности, развиваться в этом направлении и дальше. Немного работал с такими вещами, как mahout и scikit-learn, но до этого писал немало своих велосипедов. В целом, из ЯП я неплохо знаю java и python, также знаком с haskell.
На какой-то масштабный проект у меня банально нету данных, а взять готовый data set и на его базе написать что-то - неинтересно и пройденный этап. (работал с
www.informatik.uni-freiburg.de/~cziegler/BX)
Научный руководитель предлагает два варианта: либо углубиться в теорию, взяв какой-то узкий алгоритм, и попытаться его улучшить, либо поучаствовать в каком-то проекте для применения знаний на практике.
Также я размышлял над тем, чтобы помочь в меру своих скромных сил какой-то библиотеке (тот же scikit-learn, например), но тут есть ряд проблем.
Open-source проектов с уклоном именно в использование я не нашел, а вариант с углублением в теорию пугает сложностью, к тому же, популярные на данный момент проблемы так же требуют больших объемов данных.
Что можете посоветовать?