Какую посоветуете литературу (русскоязычную), по которой можно изучать data science?

Хотелось бы узнать про литературу-желательно русскоязычную- , по которой можно изучать data science(если она есть). DS хочется обхватить в приличном объёме, так что книги должны быть информативны и полны( их может быть вообще куча).

Спасибо большое.
  • Вопрос задан
  • 3385 просмотров
Пригласить эксперта
Ответы на вопрос 4
@azsx
Выскажу непопулярное мнение. Сперва обязательно убедитесь, что вы знакомы с основами статистики и теории вероятностей на уровне решения бытовых задач. Можно не лезть в дебри, но задачи из реальной жизни стоит щёлкать как орешки. Затем убедитесь, что вы знаете sql или nosql (если вам непременно big data подавай). И будет совсем великолепно, если вы сможете понимать как хранятся данные на компьютере, (например, почему символ utf8 может быть 1 или 4 байта).
Потом да, можно книжки читать. Их прекрасно применять на практике, но негде в РФ.
Ответ написан
Комментировать
@red-barbarian
По машинному обучению:
Теория - Петер Флах Машинное обучение.
Практика - Л. П. Коэльо, В. Ричард - Построение систем машинного обучения на языке Python.
Много статей есть в инете.
Ответ написан
Комментировать
dimonchik2013
@dimonchik2013
non progredi est regredi
начни с этой , дальше по поиску
например, https://habrahabr.ru/post/66561/
Ответ написан
Комментировать
Sergei_Erjemin
@Sergei_Erjemin
Улыбайся, будь самураем...
Нужно изучать базис мат-анализа и высшей алгебры. Книжки содержат слишком много практики и микро-рецептов, которую легко наработать на реальных проектах. А вот теории а них мало. Приведу пример: Купил книжечку "Python и анализ данных". Не могу сказать, что сильно помогла, но кое в чем действительно полезна. Всякие составные индексы, обработка Excel-файлов, визуализация, манимуляции с массивами... Но вот почему в одном случае надо брать один метод, а другом иной. или где нужно отбрасывать крайние значения а где нет -- загадка.

Позже случайно попался краудфандинговый проект "Статистика и Котики" и купил эту книжку. После прочтения появилось понимание приемлемости тех или иных методов анализа данных. Даже получается самому эти методики придумывать (какие характеристики объектов анализа и как измерять, где применять систему весов и балов...). Бумажную книжку, полагаю, уже не купить. А вот электронную можно найти. Очень рекомендую.

P.S. Есть еще один аспект в котором надо разбираться для успешного анализа данных. Так сказать, предметная область, понимание как получаются цифровые характеристики объектов анализа. Без этого, методики анализа приходится подбирать на ощупь и не всегда правильно. К сожалению, не всегда понимаешь как что измеряют. Например, при оцифровке характеристик текстов или изображений. Есть куча примеров в интернете, в них используют готовые библиотеки, которые выдают из текста или картинок матрицы и вектора... Дальше эти матрицы сворачивают и разворачивают, вектора перемножают и т.п. Но вот зачем и почему в таком порядке? Чтобы ко всему этому применять машинное обучение, ИМХО, очень полезно понимать как получают эти матрицы и вектора. Без этого ощущаешь себя обезьяной, которая знает какие надо сделать манипуляции, чтобы получить банан (найти похожие тексты или картинки), можно даже понимать как и почему банан движется по конвейеру к клетке, но откуда появляется банан не понимаешь. :)
Ответ написан
Комментировать
Ваш ответ на вопрос

Войдите, чтобы написать ответ

Войти через центр авторизации
Похожие вопросы