Делал недавно для блоговой платформы механизм, который генерировал ссылки на другие посты этой же платформы. Задача вполне связана с обработкой информации, довольно сложная и интересная. В самом простом варианте (для бакалавра вполне пойдет) - tf-idf получаем ключевики для каждого поста, с помощью pymorphy отбираем существительные (так можно отсеять разные мусор, который добавляет эмоции посту, но не является основной сутью), генерируем леммы и затем просто ищем пересечения лемм для каждого поста. Соответственно по пересечениям потом проставляем ссылки. Будет работать не идеально, но на большинстве постов покажет хороший результат. Таким образом сместите акцент с банального блога (который делают 90% троечников) на какой-никакой анализ данных и "науку". По опыту могу сказать, что комиссии это нравится и проблем сразу становится меньше (также мало кто понимает что происходит и дабы не показаться дураками задают меньше каверзных вопросов)