@Staffterry

Выбор темы дипломной работы?

Всем здравствуйте, прошу помочь советом по теме вопроса.

Студент 5 курса, специальность 010501 "Прикладная математика и информатика",
от научного руководителя тему получить не удалось, сказал разбираться самому.
Мучаюсь с вопросом уже почти полгода и так и не удалось найти какой-либо интересной идеи, а сроки уже поджимают. С другой стороны не хочется, чтобы диплом был написан "в стол".

Собственно область моих интересов и знаний:
  • Java SE,
  • знаком с Java EE,
  • фронтенд-технологии,
  • data mining и machine learning (писал курсовые по обзорам алгоритмов кластеризации и классификации, участвовал в решении конкурсных задач на Kaggle),
  • нейронные сети.

Так получилось, что опыта работы по специальности нет, поэтому есть желание, чтобы диплом можно было представить в качестве портфолио (планирую развиваться в качестве Java-программиста).
Другой вопрос, что для диплома требуется актуальность проблемы, использование мат.аппарата (поэтому варианты вроде обычного веб-портала не рассматриваются) и обоснованность выбора языка программирования(понятно, что выбирается инструмент под задачу, но у меня получается иначе), в связи с чем круг задач несколько ограничивается.
Есть желание поработать с Hadoop и/или Mahout, но опять же не знаю, к чему это можно применить.

P.S. Еще есть один интерес - прогнозирование спортивных событий, в частности, несколько лет играю на бирже спортивных ставок и даже есть некоторые идеи по созданию проекта в этой области, но сомневаюсь в его пригодности в качестве дипломной работы.
  • Вопрос задан
  • 7493 просмотра
Пригласить эксперта
Ответы на вопрос 2
fornit1917
@fornit1917
Добрый день. Могу предложить пару вариантов, но сразу предупреждаю - я далеко не большой специалист в интересующей вас теме.

Hadoop:
1. На Hadoop и Lucene можете попробовать реализовать свой распределенный движок полнотекстового поиска, который умеет в кластере индексировать огромный массив данных.
2. Можно попробовать реализовать преобразование некоторых SQL-запросов в задачи для Hadoop-кластера. Например есть очень большой объем данных, хранящийся в кластере. Вы хотите по нему какую-то статистику получить. Пишите запрос в привычном SQL-виде, он трансформируется в задачи для Hadoop, выполняется, и вы получаете на выходе результат.

Прогнозирование: вместо спортивного тотализатора можно обратить внимание на настоящие биржы: валютные, фондовые и т.д. и написать робота, который бы реализовывал определенную торговую стратегию. У нас на 010501 подобные темы на дипломные работы регулярно брали.
Ответ написан
Комментировать
Для data-mining нужны большие массивы информации "под рукой". Отталкивайтесь при выборе темы в первую очередь от этого.

- поиск заражений ботнетами по логам корпоративного прокси сервера
- анти-спам
- поиск нехарактерной активности пользователей корпоративной сети
- выявление авторства (идентификация анонимного автора) на интернет-форумах
- поиск зависимостей между новостями на информационных лентах и/или реальными событиями
- прогнозирование любых обменных курсов на основании новостных сайтов
- поиск зависимостей между действиями пользователей в социальных сетях или блогах

в общем фантазия при таких вводных, как у Вас, фактически не ограничена
Ответ написан
Комментировать
Ваш ответ на вопрос

Войдите, чтобы написать ответ

Похожие вопросы