Ответы пользователя по тегу Машинное обучение
  • Как найти удаленную работу по машинному обучению?

    @lightcaster
    Довольно долго работаю как (удаленный) консультант по ML. Это возможно, просто пробуйте.

    Где искать, мой опыт:
    - первого заказчика нашел на odesk
    - второго - в треде 'who is hiring' на hackernews
    остальные приходили по рекомендациям

    Несколько трюков:
    - делайте бесплатный простой прототип. Простой работающий классификатор/регрессию без оптимизаций можно сделать за пару часов. А для клиента это будет 50-70% решения задачи.
    - шлите резюме даже туда, где не думают о фрилансе или удаленной работе. Если вы хорошо делаете свою работу, им абсолютно без разницы где вы находитесь.
    - учите английский. Иногда это важней, чем ваши основные скилы в ML.

    Плюсы удаленной работы:
    - если сравнивать с нашими конторами (mail.ru, yandex), можно выйти на гораздо более высокую зарплату.
    - все заказчкики, с кем я работал, устраивали мне бесплатные поездки on-site. К примеру, так я побывал в Штатах, Ирландии, Сербии, Австрии
    - меньше долбят с проблемами, не имеющими отношения к ML

    Минусы:
    - если ты один специалист в команде, часто не с кем обсудить текущие задачи. Если постоянно не учиться, начнете деградировать.
    - сложней коммуникации. Разница во времени. Но это общие проблемы удаленки.

    ps не читайте предыдущих комментаторов :)
    pps мне так часто задают этот вопрос, что начинаю задумываться о создании специализированного сервиса по поиску удаленных data scientist'ов
    Ответ написан
    6 комментариев
  • Машинное обучение - востребовано в России?

    @lightcaster
    Мировой рынок порядка на два больше, чем российский. Смысла искать в России не вижу совершенно. Даже если в Яндекс, зарплаты гораздо ниже чем в мире. Это судя по открытым вакансиям и отзывам знакомых. Что же касается рынка вообще - специалисты очень востребованы. Пол года назад у меня было 4 клиента, и все хотели на полную ставку. Времени не хватало, пришлось отказываться.

    1) С чего начать обучение. Лучше с курсеры. Поймете прикладную часть, как применять алгоритмы. Потом можно копать вглубь. Не согласен с предыдущим комментатором, т.к. без бэкграунда читать сразу Воронцова тяжело. Может быть для мальчиков из ШАД это нормально, но там проводятся семинары, и это сильно облегчает задачу. А практически, копаться в деталях сходимости по вероятности и почти всюду, когда кушать нечего, это сомнительное удовольствие. Но лекции, вобщем-то отличные, чтобы после курсеры утрясти в голове.
    2) На одеск
    3) см выше, не вижу смысла обсуждать
    Ответ написан
    Комментировать
  • С чего начать карьеру - dataMining или "обычного" программирования?

    @lightcaster
    Если глаза загорелись, то это ваше, занимайтесь этим. Порог вхождения не такой уж высокий, просто лучше учите математику, пока у вас есть время в универе. Потом это будет дороже, знаю по себе. Рынок вакансий огромный и будет только расти. Не ориентируйтесь только на Россию, учите английский.
    Kaggle вам в помощь :).
    Ответ написан
    Комментировать
  • Можно обучить нейронную сеть монтажу видео?

    @lightcaster
    Думаю, можно.

    Но это будет непросто. Нужно много данных: исходных фрагментов и чистового видео.
    Проще, думаю, начать с автоматической обработки фотографий.
    Ответ написан
    Комментировать
  • Готовый\шаблонный сервер для обработки изображений

    @lightcaster
    Готовых нет. Сильно зависит от задачи. В последней ссылке, что вы привели, подход довольно сложный - CNN со многими слоями + хитрый рецепт для мониторинга тренировки. Вы попробуйте понять для начала, как обработка просиходит, в чем собственно алгоритм состоит. Потом станет ясно что делать на сервере.
    Ответ написан
  • Как осуществлять операции с большими матрицами?

    @lightcaster
    Может быть, вы неверно ставите задачу? Обычно поместить матрицу в память не является проблемой. Если все же проблема - работают minibatch-методы, либо что-то вроде online-обучения, где данные могут скармливаться в модель последовательно небольшими кусками.
    Ответ написан
  • Как изучать математику для Data Mining, Machine Learning и тп?

    @lightcaster
    Начните с теории вероятности, попутно пройдетесь по комбинаторике. Потом статистика.
    Параллельно - заглядывайте в функциональный анализ и линейную алгебру.

    Можно сразу же начать читать что-то вроде Мерфи или Бишопа по машинному обучению, чтоб было веселей.

    ps если вы гурман, добавьте общую алгебру на десерт :).
    Ответ написан
    Комментировать
  • Распространённые наборы данных (не текстовых) для проверки алгоритмов классификации?

    @lightcaster
    Если что-то классическое — Iris dataset — классификация цветков ириса по небольшому набору параметров. Но этот сет больше игрушечный — слишком мало семплов.

    Если серьезней, то MNIST digits — классификация рукописных цифр.
    Ответ написан
    Комментировать
  • Есть участники kaggle.com?

    @lightcaster Автор вопроса
    На счет команды согласен. Но «свои» и рядом, это роскошь :). Думаю попробую на несложном контесте, а дальше как пойдет.

    На счет семантики — плохо это знаю. Я больше на стороне статистики, так проще. Честно пытался продраться через homepages.inf.ed.ac.uk/jbos/comsem/, но так и не понял как из текста индуцировать что то формальное, вроде логики первого порядка. Для небольших текстов и грамматик проходит, но дальше игрушечных примеров дело не доходит. Так что статистика и ML выглядят более продуктивными.
    Ответ написан
    Комментировать