Ответы пользователя Максим Припадчев

Какая функция потерь наиболее подходит для колоризации изображения?

Максим Припадчев @Maksim_64

ML Engineer

Собственно и сам вопрос, как быть?

Например читать, научные статьи прям на эту тему.
https://arxiv.org/abs/2204.02980v3
справа в верхнем, доступные форматы документа. Если с английским тяжело, дай условному чату GPT подходящую часть. Пусть переведет.

Ответ написан 06 янв.

Комментировать

Как быть с тестовыми заданиями при трудоустройстве?

Максим Припадчев @Maksim_64

ML Engineer

Был фидбек, не был фидбек, не нужно воспринимать все это на свой счет. Больше, активности. Представь себе, следующую ситуацию, баскетбол. Тебе нужно забить три трех очковых подряд, это не просто. Чем больше попыток, зайти на страйк, тем больше шансы. Рецепт один, больше откликаться, выполнять тестовые задания, пытаться удивить в тестовых заданиях и т.д.

Твоя цель - оффер, и все посторонние мысли о справедливости, какая компания, какое тестовое и т.д. Они только отвлекают и мешают.

Ответ написан 05 янв.

Комментировать

Как можно разбить строку на слова по всем символам?

Максим Припадчев @Maksim_64

ML Engineer

используй регулярные выражения.
что-то вроде этого.
re.findall(r"\b\w+\b", string)
можно и re.split использовать, при желании.

Ответ написан 03 янв.

1 комментарий

Какое качество у репозиториев моих Python проектов на GitHub?

Максим Припадчев @Maksim_64

ML Engineer

1. Код не смотрел, не потому что лень, а потому что его никто смотреть не будет. Если ты доберешься до технического собеседования, то там все и решится, если нет то нет. На этапе скрининга и общения с рекрутером, наличие github увеличит твои шансы в пределах статистической погрешности.

2. Хороший или плохой код, это что то из академии, в бизнесе есть код, который отвечает требованиям бизнеса, помимо зарплаты, я еще и хорошие премии получал, за код низкого качества, написанный мной абсолютно осознанно.

Ответ написан 02 янв.

Комментировать

Какие актуальные требования для специалиста data science?

Максим Припадчев @Maksim_64

ML Engineer

чтобы были шансы на рассмотрение резюме?

Это не про знания и навыки, а про количество опыта в резюме, процентов на 95. Остальные 5, проект в резюме.

По скилам:
1. Английский

2. Бесплатная книга от создателя pandas https://wesmckinney.com/book/ она познакомит с экосистемой для классического ML (если совсем новичок, лучшая точка для старта)

3. для классического ML стека, книга (доступна бесплатно) от профессоров стенфорда + довольно сложные упражнения. https://www.statlearning.com/

4. Для нейронных сетей, нет ничего лучше чем Deep Learning with Python, Second Edition by François Chollet уникальная книга, никогда и нигде не видел объяснения продвинутых концепций столь простым языком, даже за пределами нейронных сетей.

5. Рекомендация от меня, освой dash + plotly возвращаясь к шансам на рассмотрение резюме, создай dash ML приложение, задеплой его и размести ссылку на него в резюме, это повысит шансы.

Ответ написан 31 дек. 2024

Комментировать

Как нарисовать ёлку вложенным циклом?

Максим Припадчев @Maksim_64

ML Engineer

height = int(input('Введите высоту '))
for i in range(1,height+1):
    print(f'{"#"*(i*2-1):^{height * 2}}')

Ответ написан 27 дек. 2024

Комментировать

Какой курс лучше для начала работы бизнес-аналитиком?

Максим Припадчев @Maksim_64

ML Engineer

Вопросы: как мне уйти в бизнес-анализ?

Первое на рынке труда, под данной позицией понимается, все что "захотелось, пониматься под бизнес аналитикой", конкретному работодателю. Если мы окунемся в теорию, очень упрощенно, то можно выделить два больших направления.

Анализ прошлого этим в теории и должны заниматься бизнес-аналитик, его задача на основе прошлых данных дать понимание, как все работает.

Прогнозирование будущего этим занимаются другие специалисты в зависимости от используемых инструментов.

Какие курсы помогут мне получить знания/навыки для первого оффера?

Курсы не котируются в IT все виды аналитиков, крайне сложны для входа, обычно действующий специалист, меняет направление.

Насколько важно для трудоустройства техническое образование?

Важно умение мыслить, как программист | аналитик | и т.д. Подобное мышление может быть заложено техническим образованием, а может быть и нет. Что значит мышление? Умение сводить проблему к математическому виду (для аналитиков), сама корочка играет незначительную роль.

Ответ написан 24 дек. 2024

4 комментария

Почему возникает ошибка "length mismatch: expected axis has 3 elements, new values have 4 elements"?

Максим Припадчев @Maksim_64

ML Engineer

мне вот интересно, это задания с курсов каких то безумных? Никто в реале не будет писать функции rename_columns или fillna_values. Реально, если это с курсов это ну совсем не куда не годится.

Что касается этого безумного кода.

исходный фрейм у тебя имеет 5 на самом деле 3 колонки, о чем и сказано в ошибке колонок а ты пытаешься установить, 4 вот в этой строке

test_df.columns = ['Shop_1', 'Shop_2', 'Shop_3', 'Shop_4']

пример того безумия, что происходит

df = pd.DataFrame({
    'A':[1,2,3],
    'B':[4,5,6],
    'C':[6,7,8]
})
df.columns = ['AA','BB']

Ответ написан 16 дек. 2024

13 комментариев

Как правильно тренировать навык аудирования в английском?

Максим Припадчев @Maksim_64

ML Engineer

Ну вот смотри, я свободно говорю (коммуникация в англоязычных командах не вызывает никакого стресса) и пониманию английский, учился сам.

1. Если бы меня попросили дать худший совет по улучшению различных навыков английского, то я бы сказал английский по сериалам.

2. Начинать надо с историй есть простые истории типо English with stories, и добиваться полного их понимания, тренироваться пересказывать в слух на английском.

3. Просто потреблять как можно английского контента, какие то блогеры говорят на английском, не обязательно обучающие английскому, просто по интересующей тебя тематике и т.д. Надо построить базу. Сейчас кстати c chatGPT можно пообщаться не много на английском.

По итогу: Не надо пытаться like a native, это доступно тем кто проживает в англо-говорящей среде плюс старайся прокачивать навыки (а не навык), послушал поговорил сам с собой, важно повторять услышанное.

Ответ написан 16 дек. 2024

13 комментариев

Существуют ли эталонно красиво написанные программы?

Максим Припадчев @Maksim_64

ML Engineer

"Качественный код" - весьма размытое понятие. Есть код удовлетворяющий требованиям, где-то важна архитектура, где то алгоритмы, где то и то и другое, а где то надо быстрее выдать MVP, и качество кода не важно до поры до времени.
Книги + личный опыт лучшее место.

Ответ написан 10 дек. 2024

Комментировать

Что прочитать или как разобраться(грубо говоря с чего начать)?

Максим Припадчев @Maksim_64

ML Engineer

Ищи все что связанно с transformers (архитектура deep learning).

Взаимосвязь между словами это их тема и именно она позволила создать LLM, это именно, тогда был прорыв.

Связь между словами именуется контекст. До трансформеров было например так это дополнительно зависит от архитектурного решения, что считать токеном: слово, предложение и т.д. То есть например 'Мама мыла раму', 'Мне нужно новую раму на велосипед', или что-нибудь из подвортни 'Керя ты в раму въехал'. слово 'раму' будет иметь один и тот же эмбеддинг. Так было раньше.

Трансформеры это революция они процессируют токен паралельно, и на каждом своем слое потенциально возможно обновления эмбединга слова 'раму', как и других слов. Тем самым они начали понимать контекст, иными словами эмбеддинги базируется на контексте, а не на слове.

В общем это ответ на оба вопроса. Гугли читай статьи изучай и пробуй transformers.

Ответ написан 05 дек. 2024

4 комментария

Почему не получается сохранять графики plotly как картинки?

Максим Припадчев @Maksim_64

ML Engineer

1. Код показывай что ты там делаешь.
2. попробуй конвертировать datetime (столбец с временем) в строку.

Ответ написан более года назад

1 комментарий

Как убрать/перенести приложения установленные в conda venv по ошибке или как удалить/очистить base среду в conda?

Максим Припадчев @Maksim_64

ML Engineer

в чем проблема сделать conda deactivate и затем remove (если он позволит удалить базовый). А в чем смысл создай другой активируй да и все.

Ответ написан более года назад

4 комментария

Как мне в Python добавить таблицу, учитывая формулу?

Максим Припадчев @Maksim_64

ML Engineer

Совершенно непонятно формулируешь вопрос.

1. Кого считать соседями? Если пункт А находится в радиусе или на расстоянии R от пункта B, то они соседи.

2. Земля не плоская, твоя формула евклидовой дистанции при чем здесь? для расчета дистанций есть другие специальные формулы.

3.

Как мне в Python добавить таблицу, которая дублирует первую таблицу, добавляет данные из второй таблицы, учитывая формулу выше.

Реляционные операции они происходят на основе ключа или ключей. На основании чего ты тут собрался собирать. Ты можешь найти потенциально соседей для любой взятой точки. Возникает вопрос а зачем тогда вообще две таблицы их можно просто слить в одну. Возможно связь есть, а ты о ней не рассказал.

4. По итогу из того что есть задача видится как нахождения соседей для каждой точки датасета. Я бы брут форсем, такое не решал, а использовал бы базы с approximate nearest neighbor. Построить индексы O(n log(n)), запросы O(log(n) ), ну и вся задача для каждой точки датасета O(n log(n)).

5. Используй подходящие базы ну или хотя бы geopandas. В этих случаях все инструменты уже есть.

Ответ написан более года назад

8 комментариев

Как декомпозировать задачи, с которыми ты впервые сталкиваешься?

Максим Припадчев @Maksim_64

ML Engineer

Когда не в теме умные методики и словечки не работают, только методом проб и ошибок.

Ответ написан более года назад

1 комментарий

Является ли использование разных функций активации на выходном слое нейросети плохой идеей?

Максим Припадчев @Maksim_64

ML Engineer

является ли использование разных функций активации на выходном слое нейросети плохой идеей?

Не часто используется, по сути на выходном слое у тебя будет более одного вектора, обычно они разных типов получаются, соответсвенно для каждой тебе нужно будет, своя функция потери. И общая оценка будет подразумевать оценку каждой функции потери. И ее влияния на общую систему, возможно придется вводить дополнительные веса для функций потерь. В общем рекомендую разделить архитектуру.

ДОПОЛНЕНИЕ к ответу
У нас по всей видимости недопонимание наблюдается.
1. Разные функции активации у скрытых слоев и выходного слоя дело обычное. Функция активации для выходного слоя определятся задачей которую ты решаешь, например хочу интерпретировать выходной вектор как вероятности ну и там сигмоид или софт max, или еще что то. В то время как например RELU была в скрытых. Это очень обычно и очень нормально. Когда ты говоришь о выходном слое ты спрашиваешь себя что и в каком виде мне будет выдавать.

2. Ты упомянул, разные функции активации внутри выходного слоя, обычная архитектура это одна функция активации для выходного слоя. Потому что нейронка решает или задачу классификации или регрессии или еще что то. Но существуют редко архитектуры с более чем одной функции активации то есть твоя нейронка будет решать более одного типа задачи. Это редкая практика и она ведет к серьезным усложнениям, во время тренировки тебя появляется несколько функций потерь при это а как оптимизировать? А как иметь дело с оверфитиингом. и т.д.

NEAT тут не причем. Ты делаешь нейронку которая решает несколько разных задач, этим обусловлено несколько функций активации на выходном слое. Например я хочу в ответе увидеть матрицу, первая колонка вероятности роста падения, вторая колонка цена акции. И у меня на выходном слое будет более одной фенкции активации. Так делать плохо, надо две отдельные нейронки и все.

Ответ написан более года назад

4 комментария

Как сгенерировать промежуточные координаты?

Максим Припадчев @Maksim_64

ML Engineer

import time
l = [[392,556], [95,309], [207,192]]
result = [item + [int(time.time() * 1000)] for item in l]

Ответ написан более года назад

3 комментария

Я и есть тот самый джун с 3мя годами опыта?

Максим Припадчев @Maksim_64

ML Engineer

подавайся на любой грейд и любые требования к опыту, даже если там написано более 6 лет. Посмотри, как резюме проходит скрининг, посмотри как проходишь собесы, и там видно будет.

Ответ написан более года назад

Комментировать

Книги для изучения нейронных сетей на Python?

Максим Припадчев @Maksim_64

ML Engineer

Уже отвечал на этот вопрос, пока ничего лучше не вышло.

Ответ написан более года назад

Как проверить наличие поля в JSON файле с помощью python?

Максим Припадчев @Maksim_64

ML Engineer

Объекты типа str не имеют метода get, такие методы характерны для маппингов (ключ-значение) напрмиер словарь.
get("MiddleName") нужно проверять в другом месте, где ты ожидаешь встретить данный ключ.

Ответ написан более года назад

Комментировать

Войдите на сайт