В то время как такие классики как Константин Воронцов и Александр Дьяконов заявляют, что в базовых задачах анализа данных вам не нужны супер знания математики,
Сергей Горностаев все продолжать рассказывать сказки про то, что в анализ данных приходят какие-то готовые опытные специалисты из других направлений.
У вас может быть искажено восприятие реальности, но я открываю секрет: на такие позиции даже ищут стажёров и джунов, в том числе из-за того, что больше половины работы аналитика данных заключается в том как достать данные, обработать, сделать фильтрацию и так далее. Многие из этих задач вполне способны сделать и стажёры и джуны, разумеется под присмотром более опытных коллег.
Не нужно думать что если речь про анализ данных, то это обязательно какие-то супер тяжёлые нейронки и глубокое обучение.
Так же не нужно думать, что стажёры и джуны какие-то слабаки, многие из них вполне годно знают статистику, матан, линейную алгебру и даже методы оптимизации, это примерно 2-3 курс любого мат направления.
Если ты действительно знаешь что такое производная и как она применяется, что такое градиент и некоторые матричные операции - остаётся добавить навыков питона и анализа данных, это не какие-то тяжёлые знания, для стажёра уровень будет соответствовать.
Так же не нужно думать, что аналитик данных это только работа с моделями, как я уже сказал, во многих компаниях на эту должность приходится очень много переферии, в том числе выведение моделей в прод иногда лежит на самом аналитике.
Рассказываю ещё один секрет, в 2020 году существуют такие библиотеки как xgboost, которые позволяют создать модель с приемлемой точностью, при этом не разбираясь в том, как оно работает внутри. Сказать, что так делают так называемые "макаки" - справедливо, но факт остаётся фактом - такие люди существуют только из-за того, что даже такие люди в состоянии решать задачи, никому не нужна борьба за проценты точности модели, а если нужна, то да, именно туда будут набирать супер опытных аналитиков.