Ответы пользователя Максим Припадчев

Почему self интерпретируется как None в ходе инициализации init?

Максим Припадчев @Maksim_64

Data Analyst

Не очень понятно, у тебя есть описание метода __str__, строковое представление объекта, в котором ты описал его логику (в зависимости от значения атрибутов объекта), затем, ты вызываешь print, который автоматически вызывает __str__ и там происходит ровно то что ты описал, то есть print(экземпляр класса) выведет ровно то, что возвращает __str__, если он был определен, если нет то стандартно ссылку в памяти на объект экземпляра.

Ответ написан 31 янв.

Комментировать

Нужно ли ехать в Москву из региона если устраиваешься удаленно программистом?

Максим Припадчев @Maksim_64

Data Analyst

Я так работаю, живу в регионе, а работаю удаленно, мой текущий трудовой договор подписан электронной подписью. Если интересен процесс то вот несколько пунктов.

1. Получение ЭЦП в удостоверяющем центре, стоит не дорого.

2. Дают флешку нужно еще поставить софт на компьютер, софт ставишь либо сам, либо их специалист через какой-нибудь анидеск.

3. У тебя появляется аккаунт в системе электронного документооборота например в СБИС.

4. Заходишь в свой аккаунт, либо загружаешь туда электронную версию ТК либо тебе туда ее и присылают, внимательно читаешь, если что жмешь утвердить и отсылаешь обратно, работодателю.

Все, ты официально трудоустроен, и ТК подписанный ЭЦП ни чем не отличается, от ТК подписанного в офисе.

Ответ написан 31 янв.

9 комментариев

Можно ли через numpy или pandas удалить строки в многомерном массиве, элементы которого содержат два и более разных значений?

Максим Припадчев @Maksim_64

Data Analyst

Можно хоть в numpy, хоть в pandas. Учи что такое булевая маска. И как с ее помощью выбирать подсеты массива.

array = np.array([
['петя', 'ваня', 'ира'],
["катя", 'саша', 'ира'],
['петя', 'миша', 'ира'],
['петя', 'миша','саша'],
])

cond1 = np.any((array == 'петя'), axis=1)
cond2 = np.any((array == 'ира'), axis=1)
comb = cond1 & cond2
array[~comb]

Сейчас перечитал вопрос и смотрю, в оглавлении вопроса ты одно спрашиваешь а в самом вопросе другое.

удалить строки в многомерном массиве, элементы которого содержат два и более разных значений

это означит оставить строки только с одинаковыми значениями. изпользуй np.unique()

unique_per_row = np.array([len(np.unique(row)) for row in array])
array[unique_per_row == 1]

Ответ написан 28 янв.

3 комментария

Чем автоматизировать некоторые задачи обработки фото с распознаванием местоположение лица?

Максим Припадчев @Maksim_64

Data Analyst

Если скорость не важна не надо миллионы в сутки обрабатывать то вот этот проект https://pypi.org/project/deepface/

В несколько строчек кода сможешь выполнить задачу. Проблема данного проекта он не оптимизирован под GPU, что бы GPU имело смысл, ты должен давать нейронной сети сразу несколько фото, в терминологии нейронных сетей (batch). С данной библиотекой ты просто циклом будешь проходится по списку фотографий и давать нейронным сетям по одной, что на порядки медленнее.

Если их надо миллионы в день процессировать то тогда надо напрямую с нейронкой работать и запускать на GPU RetinaFace будет хорошим выбором.

В библиотеке которую предложил собраны много моделей для определения области где расположено лицо, а также создания эмбеддингов, для последующего распознавания.

Ответ написан 26 янв.

Комментировать

Выдаёт ошибку: cannot access local variable 'status1' where it is not associated with a value. Что делать?

Максим Припадчев @Maksim_64

Data Analyst

твои if elif не покрывают всех условий. Либо добавь else и там чему равен status1, когда все вышеперечисленные условия False. Или проверяй status там не то что ожидаешь. Может например там строка, а ты проверяешь на соответствие числу, может еще что-то.

Ответ написан 07 янв.

1 комментарий

Какая функция потерь наиболее подходит для колоризации изображения?

Максим Припадчев @Maksim_64

Data Analyst

Собственно и сам вопрос, как быть?

Например читать, научные статьи прям на эту тему.
https://arxiv.org/abs/2204.02980v3
справа в верхнем, доступные форматы документа. Если с английским тяжело, дай условному чату GPT подходящую часть. Пусть переведет.

Ответ написан 06 янв.

Комментировать

Как быть с тестовыми заданиями при трудоустройстве?

Максим Припадчев @Maksim_64

Data Analyst

Был фидбек, не был фидбек, не нужно воспринимать все это на свой счет. Больше, активности. Представь себе, следующую ситуацию, баскетбол. Тебе нужно забить три трех очковых подряд, это не просто. Чем больше попыток, зайти на страйк, тем больше шансы. Рецепт один, больше откликаться, выполнять тестовые задания, пытаться удивить в тестовых заданиях и т.д.

Твоя цель - оффер, и все посторонние мысли о справедливости, какая компания, какое тестовое и т.д. Они только отвлекают и мешают.

Ответ написан 05 янв.

Комментировать

Как можно разбить строку на слова по всем символам?

Максим Припадчев @Maksim_64

Data Analyst

используй регулярные выражения.
что-то вроде этого.
re.findall(r"\b\w+\b", string)
можно и re.split использовать, при желании.

Ответ написан 03 янв.

1 комментарий

Какое качество у репозиториев моих Python проектов на GitHub?

Максим Припадчев @Maksim_64

Data Analyst

1. Код не смотрел, не потому что лень, а потому что его никто смотреть не будет. Если ты доберешься до технического собеседования, то там все и решится, если нет то нет. На этапе скрининга и общения с рекрутером, наличие github увеличит твои шансы в пределах статистической погрешности.

2. Хороший или плохой код, это что то из академии, в бизнесе есть код, который отвечает требованиям бизнеса, помимо зарплаты, я еще и хорошие премии получал, за код низкого качества, написанный мной абсолютно осознанно.

Ответ написан 02 янв.

Комментировать

Какие актуальные требования для специалиста data science?

Максим Припадчев @Maksim_64

Data Analyst

чтобы были шансы на рассмотрение резюме?

Это не про знания и навыки, а про количество опыта в резюме, процентов на 95. Остальные 5, проект в резюме.

По скилам:
1. Английский

2. Бесплатная книга от создателя pandas https://wesmckinney.com/book/ она познакомит с экосистемой для классического ML (если совсем новичок, лучшая точка для старта)

3. для классического ML стека, книга (доступна бесплатно) от профессоров стенфорда + довольно сложные упражнения. https://www.statlearning.com/

4. Для нейронных сетей, нет ничего лучше чем Deep Learning with Python, Second Edition by François Chollet уникальная книга, никогда и нигде не видел объяснения продвинутых концепций столь простым языком, даже за пределами нейронных сетей.

5. Рекомендация от меня, освой dash + plotly возвращаясь к шансам на рассмотрение резюме, создай dash ML приложение, задеплой его и размести ссылку на него в резюме, это повысит шансы.

Ответ написан 31 дек. 2024

Комментировать

Как нарисовать ёлку вложенным циклом?

Максим Припадчев @Maksim_64

Data Analyst

height = int(input('Введите высоту '))
for i in range(1,height+1):
    print(f'{"#"*(i*2-1):^{height * 2}}')

Ответ написан 27 дек. 2024

Комментировать

Какой курс лучше для начала работы бизнес-аналитиком?

Максим Припадчев @Maksim_64

Data Analyst

Вопросы: как мне уйти в бизнес-анализ?

Первое на рынке труда, под данной позицией понимается, все что "захотелось, пониматься под бизнес аналитикой", конкретному работодателю. Если мы окунемся в теорию, очень упрощенно, то можно выделить два больших направления.

Анализ прошлого этим в теории и должны заниматься бизнес-аналитик, его задача на основе прошлых данных дать понимание, как все работает.

Прогнозирование будущего этим занимаются другие специалисты в зависимости от используемых инструментов.

Какие курсы помогут мне получить знания/навыки для первого оффера?

Курсы не котируются в IT все виды аналитиков, крайне сложны для входа, обычно действующий специалист, меняет направление.

Насколько важно для трудоустройства техническое образование?

Важно умение мыслить, как программист | аналитик | и т.д. Подобное мышление может быть заложено техническим образованием, а может быть и нет. Что значит мышление? Умение сводить проблему к математическому виду (для аналитиков), сама корочка играет незначительную роль.

Ответ написан 24 дек. 2024

4 комментария

Почему возникает ошибка "length mismatch: expected axis has 3 elements, new values have 4 elements"?

Максим Припадчев @Maksim_64

Data Analyst

мне вот интересно, это задания с курсов каких то безумных? Никто в реале не будет писать функции rename_columns или fillna_values. Реально, если это с курсов это ну совсем не куда не годится.

Что касается этого безумного кода.

исходный фрейм у тебя имеет 5 на самом деле 3 колонки, о чем и сказано в ошибке колонок а ты пытаешься установить, 4 вот в этой строке

test_df.columns = ['Shop_1', 'Shop_2', 'Shop_3', 'Shop_4']

пример того безумия, что происходит

df = pd.DataFrame({
    'A':[1,2,3],
    'B':[4,5,6],
    'C':[6,7,8]
})
df.columns = ['AA','BB']

Ответ написан 16 дек. 2024

13 комментариев

Как правильно тренировать навык аудирования в английском?

Максим Припадчев @Maksim_64

Data Analyst

Ну вот смотри, я свободно говорю (коммуникация в англоязычных командах не вызывает никакого стресса) и пониманию английский, учился сам.

1. Если бы меня попросили дать худший совет по улучшению различных навыков английского, то я бы сказал английский по сериалам.

2. Начинать надо с историй есть простые истории типо English with stories, и добиваться полного их понимания, тренироваться пересказывать в слух на английском.

3. Просто потреблять как можно английского контента, какие то блогеры говорят на английском, не обязательно обучающие английскому, просто по интересующей тебя тематике и т.д. Надо построить базу. Сейчас кстати c chatGPT можно пообщаться не много на английском.

По итогу: Не надо пытаться like a native, это доступно тем кто проживает в англо-говорящей среде плюс старайся прокачивать навыки (а не навык), послушал поговорил сам с собой, важно повторять услышанное.

Ответ написан 16 дек. 2024

13 комментариев

Существуют ли эталонно красиво написанные программы?

Максим Припадчев @Maksim_64

Data Analyst

"Качественный код" - весьма размытое понятие. Есть код удовлетворяющий требованиям, где-то важна архитектура, где то алгоритмы, где то и то и другое, а где то надо быстрее выдать MVP, и качество кода не важно до поры до времени.
Книги + личный опыт лучшее место.

Ответ написан 10 дек. 2024

Комментировать

Что прочитать или как разобраться(грубо говоря с чего начать)?

Максим Припадчев @Maksim_64

Data Analyst

Ищи все что связанно с transformers (архитектура deep learning).

Взаимосвязь между словами это их тема и именно она позволила создать LLM, это именно, тогда был прорыв.

Связь между словами именуется контекст. До трансформеров было например так это дополнительно зависит от архитектурного решения, что считать токеном: слово, предложение и т.д. То есть например 'Мама мыла раму', 'Мне нужно новую раму на велосипед', или что-нибудь из подвортни 'Керя ты в раму въехал'. слово 'раму' будет иметь один и тот же эмбеддинг. Так было раньше.

Трансформеры это революция они процессируют токен паралельно, и на каждом своем слое потенциально возможно обновления эмбединга слова 'раму', как и других слов. Тем самым они начали понимать контекст, иными словами эмбеддинги базируется на контексте, а не на слове.

В общем это ответ на оба вопроса. Гугли читай статьи изучай и пробуй transformers.

Ответ написан 05 дек. 2024

4 комментария

Почему не получается сохранять графики plotly как картинки?

Максим Припадчев @Maksim_64

Data Analyst

1. Код показывай что ты там делаешь.
2. попробуй конвертировать datetime (столбец с временем) в строку.

Ответ написан 01 дек. 2024

1 комментарий

Как убрать/перенести приложения установленные в conda venv по ошибке или как удалить/очистить base среду в conda?

Максим Припадчев @Maksim_64

Data Analyst

в чем проблема сделать conda deactivate и затем remove (если он позволит удалить базовый). А в чем смысл создай другой активируй да и все.

Ответ написан 01 дек. 2024

4 комментария

Как мне в Python добавить таблицу, учитывая формулу?

Максим Припадчев @Maksim_64

Data Analyst

Совершенно непонятно формулируешь вопрос.

1. Кого считать соседями? Если пункт А находится в радиусе или на расстоянии R от пункта B, то они соседи.

2. Земля не плоская, твоя формула евклидовой дистанции при чем здесь? для расчета дистанций есть другие специальные формулы.

3.

Как мне в Python добавить таблицу, которая дублирует первую таблицу, добавляет данные из второй таблицы, учитывая формулу выше.

Реляционные операции они происходят на основе ключа или ключей. На основании чего ты тут собрался собирать. Ты можешь найти потенциально соседей для любой взятой точки. Возникает вопрос а зачем тогда вообще две таблицы их можно просто слить в одну. Возможно связь есть, а ты о ней не рассказал.

4. По итогу из того что есть задача видится как нахождения соседей для каждой точки датасета. Я бы брут форсем, такое не решал, а использовал бы базы с approximate nearest neighbor. Построить индексы O(n log(n)), запросы O(log(n) ), ну и вся задача для каждой точки датасета O(n log(n)).

5. Используй подходящие базы ну или хотя бы geopandas. В этих случаях все инструменты уже есть.

Ответ написан 01 дек. 2024

8 комментариев

Как декомпозировать задачи, с которыми ты впервые сталкиваешься?

Максим Припадчев @Maksim_64

Data Analyst

Когда не в теме умные методики и словечки не работают, только методом проб и ошибок.

Ответ написан 30 нояб. 2024

1 комментарий

Войдите на сайт