Комментарии пользователя Максим Припадчев

Хочу попробовать стать системным аналитиком, с чего лучше начать и во сколько попытаться найти работу?

Максим Припадчев @Maksim_64

beswalod, Хочешь что то сделать хорошо, сделай это сам. Учится надо самому.

Какие темы в статистике нужно изучить прежде всего, чтобы начать решать простые задачи машинного обучения?

Максим Припадчев @Maksim_64

Its_Suchkov, На русском она совсем не полная. Статистика на Khan Academy слабенькая совсем. Там курсы Precalculus, Calculus AB, Calculus BC. Вот эти курсы очень сильные.

Написано 26 мая

Какие темы в статистике нужно изучить прежде всего, чтобы начать решать простые задачи машинного обучения?

Максим Припадчев @Maksim_64

Its_Suchkov, учил английский. Это навык на всю жизнь, который пригодится за пределами ML.

Написано 25 мая

Какие темы в статистике нужно изучить прежде всего, чтобы начать решать простые задачи машинного обучения?

Максим Припадчев @Maksim_64

Its_Suchkov, Ты не сможешь решать задачи по теории вероятности, с непрерывной переменной. А смысл учить дисциплину, если не решать задачи.

Написано 25 мая

Какие темы в статистике нужно изучить прежде всего, чтобы начать решать простые задачи машинного обучения?

Максим Припадчев @Maksim_64

Its_Suchkov, Относительно ML инженера, да в целом очень полезно, это расширяет мышление. В какой то момент своего обучения ты можешь пройти курс по CS (Computer Science) и там это будет, это добавит к твоему мышлению. Важно научится думать, это определенно помогает.

Написано 25 мая

Какие темы в статистике нужно изучить прежде всего, чтобы начать решать простые задачи машинного обучения?

Максим Припадчев @Maksim_64

Its_Suchkov, Курсы с KhanAcademy там есть все кроме дискретной математики, на сколько я помню они на английском, но тут как я говорил ранее, без английского будет очень тяжело, я бы с него начал.

Написано 25 мая

Стоит ли беспокоится, если иду в NLP, но я плох на числовых табличных данных?

Максим Припадчев @Maksim_64

Its_Suchkov,

1. Фреймворки и код дело 10.

2. Линейная регрессия - это алгоритм, а не база.

Пока, как я тебе уже говорил у тебя не правильная система координат. Нет общей картинки, а ты уходишь в частности. Соотвественно, прогресса не будет.

Написано 12 мая

Стоит ли беспокоится, если иду в NLP, но я плох на числовых табличных данных?

Максим Припадчев @Maksim_64

Its_Suchkov,
Да, можешь начинать. Проблема не в линейной регрессии и не возможности реализовать ее на numpy.

Проблема в отсутствии общей картинки. Что такое таргет, что такое фича, что такое функция потерь, что такое метод оптимизации и т.д. Все вот это не укладывается в твоей голове.

Читай медленно и практикуйся на каждом уровне. Это даст общую картинку. Значительно проще решать задачи, когда ты понимаешь что вокруг.

Книга даст понимания общего пайплайна машинного обучения.

Написано 12 мая

Стоит ли беспокоится, если иду в NLP, но я плох на числовых табличных данных?

Максим Припадчев @Maksim_64

Its_Suchkov, Учи, как по мне так это обязательное требование даже для рынка РФ.
Попробуй Deep Learning with Python by François Chollet.

Второе издание есть на русском. Книга тебя научит думать как инженер.

Написано 12 мая

Стоит ли беспокоится, если иду в NLP, но я плох на числовых табличных данных?

Максим Припадчев @Maksim_64

Its_Suchkov, английский знаешь?

Написано 12 мая

Стоит ли беспокоится, если иду в NLP, но я плох на числовых табличных данных?

Максим Припадчев @Maksim_64

Its_Suchkov,

Смотри, ты думаешь, если ты решишь задачу, то ты чему то научишься. Нет, ты не чему не научишься. Твоя проблема ты не понимаешь, как думать о задачах машинного обучения.

Мой тебе совет, купи себе книгу и начни с книг.

Написано 12 мая

Стоит ли беспокоится, если иду в NLP, но я плох на числовых табличных данных?

Максим Припадчев @Maksim_64

Михаил Р., При чем тут деньги, о них и речи идти не может.

Написано 12 мая

Стоит ли беспокоится, если иду в NLP, но я плох на числовых табличных данных?

Максим Припадчев @Maksim_64

Its_Suchkov,

NLP на много сложнее, чем вступительная задача регрессии. Просто в нлп ты запустил код, который запустился и все.

Написано 12 мая

Стоит ли беспокоится, если иду в NLP, но я плох на числовых табличных данных?

Максим Припадчев @Maksim_64

Its_Suchkov,

Нет категорий, например вот это street_id - категрия алгоритм может интепритировать как число. Нет тренировнчого мае, хотя бы крос валидацию какую нибудь сделать, что бы посмотреть а у меня хотя бы на тренировочном датасете есть обучение какое нибудь.

В общем отсуствует базовая работа с данными, а ты зачем то ансамбли изучаешь, которые будут голосовать за лучшую модель.

МЛ начинается с обработки данных а не с моделей, у тебя этого нет.

Какие фичи категории, какой енкодинг к ним применен, какие фичи непрерывные какие трансформации к ним применкны. Какие метрики на обучающие выборке?

ничего это нет.

Написано 12 мая

Стоит ли беспокоится, если иду в NLP, но я плох на числовых табличных данных?

Максим Припадчев @Maksim_64

Its_Suchkov,

Здесь есть две части.
Если на этапе обучения что то дается сложно, значит ты к этому не готов, ты что то пропустил или не достаточно провел времени на более простых задачах, подумай об этом, что будет дальше.

Теперь по задаче, что такое МАЕ это метрика для задач регрессии (задача) где твоя цель непрерывная перменная. Обзначим ее у. У тебя есть набор фичей|переменных|предикторов их по разному могут газывать, обозначим их X.

и так
y - цена на недвижимость
X - твои фичи табдичные данные() Например, локация, квадратура и др.

в процессе машинного обучения ты ищешь функцию f которая на вход получит X и сделает прогноз цены.
то есть.

f(X) = y'
где y' - это предсказание. Функция должна минимизировать ошибку на тренировчном датасете и показать хорошую генерализцаю на тестовом. По скольку алгоритм в процессе обучения ищет такую f которая минимизирует y - y' , твою ошибку.

Теперь к MAE это метрика точности, одна из воможных. Очень простая.

MAE = mean(|y-y'|)

Он у тебя большой в среднем ты очень сильно ошибаешься.

Если в твоем пайплане все в порядке, то алгоритм не может давать такую большую ошибку.

Скорее всего что с трансформацией данных, и где то в пайплане у тебя попадают очень большие цифры, а ожидаются маленькие, например ты где то провел нормализацию данных, а когда ты делаешь predict то туда попадает X с не обработанными данными.

Написано 12 мая

Стоит ли беспокоится, если иду в NLP, но я плох на числовых табличных данных?

Максим Припадчев @Maksim_64

Its_Suchkov,

Берешь задачу, декомпозируешь на части.
Спрашиваешь что не понятно.

Написано 11 мая

Стоит ли беспокоится, если иду в NLP, но я плох на числовых табличных данных?

Максим Припадчев @Maksim_64

Its_Suchkov,

Вопрос удалят, здесь запрещены разборы задач.

Написано 11 мая

С какой стороны подобраться к изучению программирования в области ИИ?

Максим Припадчев @Maksim_64

Vitsliputsli,

Проект 1: существующая кодовая база переписана, и доработана и продолжает в данный момент доробатыватся с помощью ИИ. Проект использует пред тренированные модели для работы с фотографиями, поток фотографий несколько миллионов в день, работает все на GPU. По сути это множество пайплайнов, фото->векторное представление, которое отправляются в векторную бд, затем к этому уже коннектятся различные приложения, как пользовательские так всякого рода инференц, аналитика и т.д. С декабря 2025 ИИ пишет весь код. Вся команда, говорит Клоду что писать, он создает новые файлы, модифицирует существующие, и т.д. роль человека ревью, архитектура ну и идеи естественно.

Проект 2: Классический датасаенс, создание "интерпретируемых моделей и нахождение стратегий", из данных поведения участников игр. Этот проект совсем свежий 90 процентов существующих пайпланов созданы клодом. Работает идеально, что касается аналитической части выводов, нахождения лучших стратегий и т.д. то тут от него толку мало. Но как только у тебя есть идея, он напишет код великолепно. Я последний раз писал код в ноябре 2025. Сейчас иногда пишу не большие кусочки кода, при работе с данными, не потому что клод не может или сделает хуже, а потому что мне это помогает думать. После теста чего-нибудь, я ставлю задачу клоду внедрить то или иное в кодовую базу и даю указания + псевдо код, как я хочу с этим работать, он все выполняет. Очень удобно.

Написано 24 янв.

С какой стороны подобраться к изучению программирования в области ИИ?

Максим Припадчев @Maksim_64

Vitsliputsli, на работе, где же еще. В двух проектах в которых я сейчас работаю, claude opus 4.5 пишет весь код. У моих друзей тоже самое, они больше не пишут код.

Написано 24 янв.

Правильный ли ход мыслей к обучению?

Максим Припадчев @Maksim_64

historydev, Можем и не экстраполировать, Claude Code (уверен что не только он) уже сегодня пишет код лучше чем я, зачем я буду советовать кому то инвестировать свое время в изучение программирования, если все здесь уже сейчас. В написании кода человек vs ИИ это игра в которую нельзя выиграть, лучше играть в игры в которые можно побеждать.

Ты конечно можешь мне сказать, что лучше тебя не значит, что программисты больше не нужны. Но у меня нет целей победить тебя в этой дискуссии.

Написано 16 янв.

Войдите на сайт