@StartPy

Мне необходимо выбрать тему диплома, связанную с BIG DATA, e-commerce. Какую лучше взять?

Мне необходимо выбрать тему диплома, связанную с анализом больших данных или с областью электронной коммерцией И одну из выбранных тем увязать с вебом.
Я предоставил науч руку список тем, которые придумал сам. Например я предложил сделать классификатор текстов (скажем по нескольким категориям), ещё веб-платформу, которая будет с помощью нейронок анализировать изображения. - это тематика Биг Дата. По электронной коммерции я хотел запилить интернет-магазин, подкрутить платежку и показать на примере что такое эл коммерция.
Но науч рук сказал что темы очень шаблонны и изъезженные. Говорит придумай что-то с научной ценностью. Я не могу придумать что-то с этой тематикой, что можно реализовать достаточно негеморойно и что устроит придирчивого препода. Не накидаете идей?) Просто идея и кратенькое описание что она из себя представляет и что там вообще делать. Спасибо)
  • Вопрос задан
  • 421 просмотр
Пригласить эксперта
Ответы на вопрос 4
@dmshar
Время, когда любую задачу машинного обучения гордо обзывали Big Data давно прошло. Big Data тем и отличается от традиционного Mаchine Learning (включая нейронки между прочим), что данных должно быть очень много. Очень. Очень-очень-очень. Настолько много, что вы не в состоянии решить задачу без распараллеливания, без специальных методов работы с постоянной подкачкой и пр. Big Data - это не классификаторы, не кластеризация и не Deep Learning. Это Hadoop и все, что вокруг него, это MapReduce, это Spark, X-plenty, Cassandra, всякие Hana, Teradata, Talend и пр.
Вы точно это имеете ввиду, когда говорите про Big Data? И у вас есть терабайты этих самых данных, и доступ к соответствующим инструментам их обработки? Интернет-магазин, говорите? У вас есть доступ к данным Amazon?
Может для начала стоит хоть с терминологией правильной разобраться (хотя диплом, что-то же вы 4 или 6 лет все-таки учили?), а уж потом думать про диплом.
И если вы все-таки решите писать работу в области Machine Learning, то рекомендую для начала подумать, к каким данным у вас есть реально доступ, а уж исходя из этого и тему придумывать.
Ответ написан
Комментировать
sergey-gornostaev
@sergey-gornostaev
Седой и строгий
Bigdata и при этом не геморройное? Не бывает.
Ответ написан
samodum
@samodum
Какой вопрос - такой и ответ
Big Data для диплома?
Это нереально. Или у тебя, обычного студента, есть доступ к огромным хранилищам данных? К многим терабайтам данных?
Ответ написан
Комментировать
mayton2019
@mayton2019
Bigdata Engineer
У гугла есть открытые учебные датасеты. Можно их посмотреть. Там и графика. И финансовая информация.

По поводу терабайтов в открытом доступе. Я не находил. В рамках студенческой дипломной работы трудно будет найти бесплатное облако или кластер который будет способен перемалывать терабайты за доступное время. Поэтому я-бы не ставил упор на объём.

Но можно найти гигабайты. Географические базы. https://www.openstreetmap.org/
Там есть данные по 40 гигабайт в XML формате. География - кстати очень интересная тема.
Особенно если данные географии накладывать на какие-то другие. Экология там... ковид. И прочее.
Ответ написан
Комментировать
Ваш ответ на вопрос

Войдите, чтобы написать ответ

Войти через центр авторизации
Похожие вопросы