Пользователь пока ничего не рассказал о себе

Наибольший вклад в теги

Все теги (7)

Лучшие ответы пользователя

Все ответы (8)
  • Какую выбрать тему/проект для диплома?

    @ezavialov

    Я бы очень посоветовал вам взять одно из заданий с kaggle.com и добиться там достойного места.

    Ответ написан
    2 комментария
  • Инструмент для анализа статистики приложения!?

    @ezavialov

    Вам уже посоветовали R, но я бы не его рекомендовал. Дело в том, что как язык программирования он просто ужасен (его используют уже на разжеванных, готовых данных, всю логику по обрабтке логов лучше делать на python/java/etc), поэтому лучше сделайте так:
    0) Для сложной аналитики возможностей GA может не хватить, в таком случае вы можете реализовать систему аналитики самостоятельно, но учтите что это довольно трудоемко. Готовых инструментов как таковых нет (если вам нужны возможности, большие чем GA), поэтому придется реализовать все самому.
    1) Выработайте четкий план того, что именно вы хотите измерять. Понимаю, что без опыта это сделать сложно, но поверьте, лучше это сделать сейчас, чем через месяц, когда вы уже убили кучу времени на написание серверной логики по обработке статистики. Если для ваших задач хватает GA, используйте его и не парьтесь. Если нет, см. п. 2
    2)Отбросьте все не нужное и мало значимое из п. 1. Оставьте только самое важное, что вам гарантированно пригодится.
    3)Реализуйте это наипростейшим образом (но так, чтобы в ходе реализации вы бы создали инфраструктуру, позволяющую написать дополнительные метрики как можно быстрее).
    4)Получите первые данные и попробуйте с уже имеющимися метриками решить задачу. К этому моменту вам станет ясно, каких метрик не хватает. Вернитесь к пункту 1.

    Ответ написан
    Комментировать
  • Работа для прикладного математика

    @ezavialov
    В России и Украине работы по этому направлению довольно мало. По крайней мере, на hh.ru ее почти нет (3 вакансии в Москве по data mining vs несколько сотен по java). Самым проторенным и соблазнительным, с точки зрения порога вхождения, выглядит создание всевозможных скоринг моделей, аналитических систем и отчетов в различных системах (например, SAS) "программирования мышкой". Но, лично мне это не кажется привлекательным.
    Я бы посоветовал особо не спешить, и несколько лет развиваться в этом направлении самостоятельно (посмотри в сторону kaggle.com). Основная сложность вхождения в data mining состоит в том, что порог весьма велик. Поэтому джуниором серьезные компании тебя навряд ли возьмут (хотя, всякое может быть).
    Кроме того, в data mining существует огромное кол-во направлений и одним лишь курсом с coursera их все не захватить. Для увеличения кругозора советую посмотреть еще курс лекция профессора Воронцова на ШАД. + изучи ресурс machinelearning.ru/
    Ответ написан
    1 комментарий