Задать вопрос

Существуют ли заочные курсы или стажировка по анализу данных на русском языке?

Я профессиональный PHP-разработчик (+7 лет опыта), недавно загорелся изучением Python с уклоном в анализ данных. Посему интересует вопрос - имеется ли в каких-нибудь российских компаниях или университетах возможность удаленно стажироваться или обучаться по данному направлению?

Всё усложняется тем, что живу я в провинции, поэтому нужна возможность именно заочной стажировки или обучения. Получение стипендии для меня роли не играет, нужны только знания. Готов наоборот сам заплатить адекватную сумму за такую возможность.

Хотелось бы найти программу на русском языке, так как английский у меня пока довольно слабый: смог более-менее понять курс Machine Learning на Coursera, но с общением на английском большие проблемы.

Про ШАД Яндекса знаю, но для поступления туда нужен очень хороший математический бэкграунд, чем я пока похвастаться не могу. Может быть есть что-нибудь не с таким высоким порогом входа?
  • Вопрос задан
  • 14291 просмотр
Подписаться 53 Простой 2 комментария
Решения вопроса 1
@lPolar
data scientist
ИМХО, тут есть несколько аспектов:
1. Как написал brainick , математический бэкграунд и английский в data science практически обязателен.
Причин этому несколько: отсутствие хорошей литературы на русском языке (как по теории, так и по программированию), обилие английских терминов (lift/top/cross-validation и прочие), значение которых в переводной литературе порой объяснятся весьма туманно.
2. Если говорить о конкретной литературе, которую стоит почитать, я бы выделил несколько уровней:
Уровень 0
1. Бизнес-аналитика - Паклин, Орешков (самое базовое и обзорное введение)
2. Статистика/Тервер ( по мне, хороши книги Айвазяна/Мхитаряна)
3. SQL - в обязательном порядке. Мне в свое время помогла книга "SQL для простых смертных"
4. Изучаем Python - М. Лутц (наиболее полная книга по языку, все что нужно для data science здесь точно есть)
5. Программируем коллективный разум (к слову сказать, вот в этой книге отличный перевод)
Уровень 1
1. Математические основы машинного обучения и прогнозирования - Вьюгин (книга сложная, без подготовки по учебникам НМУ на тему анализа и линейной алгебры лучше не подходить)
2. Python for Data Analysis (pandas во всей красе, тут нечего добавить)
3. Примеры и статьи по построению моделей в sklearn - на хабре в последнее время часто мелькают статьи на эту тему, там все достаточно хорошо расписано.
Уровень 2
1. Hadoop и иже с ним ("Hadoop в действии", "Programming Pig")
2. Apache Spark - достаточно почитать описание Python API.
Тут есть еще один момент - не стоит слишком привязываться к одному языку и фреймворку.
Одна из неприятных проблем python+pandas+sklearn заключается в том, что эта связка слабо масштабируется - при 2-3-4 гб данных становится сложно разместить их в оперативной памяти. Я знаю про chunk-reading+partial_fit, но точность таких моделей оставляет желать лучшего.
С другой стороны, если обрабатывать эти данные в pyspark, то теряется все удобство pandas.DataFrame и так далее. Отрасль data science быстро развивается и обрастает новыми технологиями, так что нужно все время держать руку на пульсе.
UPD: в spark 1.3 появились DataFrame.
Ответ написан
Пригласить эксперта
Ответы на вопрос 3
Вот есть лекции от JetBrains
pep8.ru/video/101
вообще вот подборка видео докладов о python pep8.ru/video/?page=5
Ответ написан
@krog
Developer
Комментировать
@Bugoved
Соглашусь с предыдущими сообщениями о том, что анализ данных без математики вряд ли возможен, так что может с неё всё-таки начать?
Вы попробуйте в ШАД за это руку не отрубают! ;) Там вообще довольно приятные люди и если даже не поступите, то по крайней мере узнаете много нового и поймёте чего вам не хватает (особенно если дойдёте до собеседования). К тому же кажется, что к заочникам у ШАДа более лояльное отношение.
Как раз весной набор, подготовиться, конечно, придётся, но там ничего сверхъестественного, по собственному опыту знаю (примерно первые пару курсов матфака). Многие пишут, что готовились самостоятельно, я, честно говоря, не готовилась совсем, но на это равняться не стоит, поскольку имею математическое образование.
Успехов! ;)
Ответ написан
Комментировать
Ваш ответ на вопрос

Войдите, чтобы написать ответ

Похожие вопросы