@RadmirZ
Делаем интернет-магазины на движке minicart.su

Хочу занятся проектом (стартапом) с использованием Big Data — с чего начать?

Есть идея стартапа с использованием big data и визуализации, с чего можно начать изучение темы.
Также планируется вести анализ собранных статистических данных (в идеале миллионы записей) есть ли у кого опыт как это вообще реализуется и в какую сторону можно смотреть (изучать).
  • Вопрос задан
  • 1560 просмотров
Решения вопроса 2
@lPolar
data scientist
Для начала надо понять нужна ли Вам Big Data habrahabr.ru/post/194434
Если у вас не совсем Big Data, то можно взять вот такие инструменты:
1. Pandas - обработка данных, I/O
2. Sklearn - построение моделей
3. В плане БД для хранения возможны варианты:
3.1 SQL-базы - SQLite, постгрес
3.2 NoSQL - Mongo и т.д.
4. Если предполагается, что часть данных будет использоваться более активно, т.е. вам нужно горячее кеширование - возьмите Redis или его аналоги
Если у Вас действительно Big Data, то на мой взгляд вам хватит следующих инструментов:
Apache Kafka - онлайн процессинг данных
Apache Sqoop - для того чтобы тягать данные из реляционных баз
Apache Hive - чтобы все это хранить в удобоваримом виде
Apache Spark - чтобы строить предиктивные модели и всякие неклассические группировки
С визуализацией дела обстоят сложнее. Для начала нужно понять какая визуализация нужна - статическая или динамическая + язык, на котором лично Вам будет удобнее писать визуализацию.
Если визуализируем в статике (в .jpg файлы, например), то вот так:
R - lattice,ggplot2
Python - matplotlib,seaborn
Если хотим суперклассные дешборды в реалтайме, то вот так:
R - Shiny
Python - bokeh
P.S. Вы бы для начала написали какие источники данных у Вас, будет проще понять что копать и какими инструментами.
Ответ написан
Комментировать
dizballanze
@dizballanze
Software developer at Yandex
Копайте Hadoop, Kafka, Storm, Apache Spark, R.
Ответ написан
Пригласить эксперта
Ответы на вопрос 3
BuriK666
@BuriK666
Компьютерный псих
миллион это не bigdata, Для начала советую посмотреть www.youtube.com/watch?v=TEHdfPa1eJA
Ответ написан
begemot_sun
@begemot_sun
Программист в душе.
Начать с того, что подумать "а кому это нужно?" и предложить тому свои услуги.
Ответ написан
@vip1987
Начинающий веб-разработчик
Согласен с Сергеем) надо сначала определить целевую аудиторию, а потом уже думать "Кому что и с чем подавать!"))) Ну Вы поняли о чем я) а то Azure пока что рулит...
Ответ написан
Комментировать
Ваш ответ на вопрос

Войдите, чтобы написать ответ

Похожие вопросы