Задать вопрос
  • Чем теперь пользоваться, когда Хабр Фриланс закрылся?

    Maksim_64
    @Maksim_64
    Data Analyst
    Делай хорошее, привлекательное резюме, и размещай его на сайтах поиска работы, пока и они еще не умерли.
    Ответ написан
    8 комментариев
  • Почему self интерпретируется как None в ходе инициализации __init__?

    Maksim_64
    @Maksim_64
    Data Analyst
    Не очень понятно, у тебя есть описание метода __str__, строковое представление объекта, в котором ты описал его логику (в зависимости от значения атрибутов объекта), затем, ты вызываешь print, который автоматически вызывает __str__ и там происходит ровно то что ты описал, то есть print(экземпляр класса) выведет ровно то, что возвращает __str__, если он был определен, если нет то стандартно ссылку в памяти на объект экземпляра.
    Ответ написан
    Комментировать
  • Нужно ли ехать в Москву из региона если устраиваешься удаленно программистом?

    Maksim_64
    @Maksim_64
    Data Analyst
    Я так работаю, живу в регионе, а работаю удаленно, мой текущий трудовой договор подписан электронной подписью. Если интересен процесс то вот несколько пунктов.

    1. Получение ЭЦП в удостоверяющем центре, стоит не дорого.

    2. Дают флешку нужно еще поставить софт на компьютер, софт ставишь либо сам, либо их специалист через какой-нибудь анидеск.

    3. У тебя появляется аккаунт в системе электронного документооборота например в СБИС.

    4. Заходишь в свой аккаунт, либо загружаешь туда электронную версию ТК либо тебе туда ее и присылают, внимательно читаешь, если что жмешь утвердить и отсылаешь обратно, работодателю.

    Все, ты официально трудоустроен, и ТК подписанный ЭЦП ни чем не отличается, от ТК подписанного в офисе.
    Ответ написан
    9 комментариев
  • Можно ли через numpy или pandas удалить строки в многомерном массиве, элементы которого содержат два и более разных значений?

    Maksim_64
    @Maksim_64
    Data Analyst
    Можно хоть в numpy, хоть в pandas. Учи что такое булевая маска. И как с ее помощью выбирать подсеты массива.
    array = np.array([
    ['петя', 'ваня', 'ира'],
    ["катя", 'саша', 'ира'],
    ['петя', 'миша', 'ира'],
    ['петя', 'миша','саша'],
    ])
    
    cond1 = np.any((array == 'петя'), axis=1)
    cond2 = np.any((array == 'ира'), axis=1)
    comb = cond1 & cond2
    array[~comb]


    Сейчас перечитал вопрос и смотрю, в оглавлении вопроса ты одно спрашиваешь а в самом вопросе другое.
    удалить строки в многомерном массиве, элементы которого содержат два и более разных значений
    это означит оставить строки только с одинаковыми значениями. изпользуй np.unique()

    unique_per_row = np.array([len(np.unique(row)) for row in array])
    array[unique_per_row == 1]
    Ответ написан
    3 комментария
  • Чем автоматизировать некоторые задачи обработки фото с распознаванием местоположение лица?

    Maksim_64
    @Maksim_64
    Data Analyst
    Если скорость не важна не надо миллионы в сутки обрабатывать то вот этот проект https://pypi.org/project/deepface/

    В несколько строчек кода сможешь выполнить задачу. Проблема данного проекта он не оптимизирован под GPU, что бы GPU имело смысл, ты должен давать нейронной сети сразу несколько фото, в терминологии нейронных сетей (batch). С данной библиотекой ты просто циклом будешь проходится по списку фотографий и давать нейронным сетям по одной, что на порядки медленнее.

    Если их надо миллионы в день процессировать то тогда надо напрямую с нейронкой работать и запускать на GPU RetinaFace будет хорошим выбором.

    В библиотеке которую предложил собраны много моделей для определения области где расположено лицо, а также создания эмбеддингов, для последующего распознавания.
    Ответ написан
    Комментировать
  • Выдаёт ошибку: cannot access local variable 'status1' where it is not associated with a value. Что делать?

    Maksim_64
    @Maksim_64
    Data Analyst
    твои if elif не покрывают всех условий. Либо добавь else и там чему равен status1, когда все вышеперечисленные условия False. Или проверяй status там не то что ожидаешь. Может например там строка, а ты проверяешь на соответствие числу, может еще что-то.
    Ответ написан
    1 комментарий
  • Какая функция потерь наиболее подходит для колоризации изображения?

    Maksim_64
    @Maksim_64
    Data Analyst
    Собственно и сам вопрос, как быть?

    Например читать, научные статьи прям на эту тему.
    https://arxiv.org/abs/2204.02980v3
    справа в верхнем, доступные форматы документа. Если с английским тяжело, дай условному чату GPT подходящую часть. Пусть переведет.
    Ответ написан
    Комментировать
  • Как быть с тестовыми заданиями при трудоустройстве?

    Maksim_64
    @Maksim_64
    Data Analyst
    Был фидбек, не был фидбек, не нужно воспринимать все это на свой счет. Больше, активности. Представь себе, следующую ситуацию, баскетбол. Тебе нужно забить три трех очковых подряд, это не просто. Чем больше попыток, зайти на страйк, тем больше шансы. Рецепт один, больше откликаться, выполнять тестовые задания, пытаться удивить в тестовых заданиях и т.д.

    Твоя цель - оффер, и все посторонние мысли о справедливости, какая компания, какое тестовое и т.д. Они только отвлекают и мешают.
    Ответ написан
    Комментировать
  • Как можно разбить строку на слова по всем символам?

    Maksim_64
    @Maksim_64
    Data Analyst
    используй регулярные выражения.
    что-то вроде этого.
    re.findall(r"\b\w+\b", string)
    можно и re.split использовать, при желании.
    Ответ написан
    1 комментарий
  • Какое качество у репозиториев моих Python проектов на GitHub?

    Maksim_64
    @Maksim_64
    Data Analyst
    1. Код не смотрел, не потому что лень, а потому что его никто смотреть не будет. Если ты доберешься до технического собеседования, то там все и решится, если нет то нет. На этапе скрининга и общения с рекрутером, наличие github увеличит твои шансы в пределах статистической погрешности.

    2. Хороший или плохой код, это что то из академии, в бизнесе есть код, который отвечает требованиям бизнеса, помимо зарплаты, я еще и хорошие премии получал, за код низкого качества, написанный мной абсолютно осознанно.
    Ответ написан
    Комментировать
  • Какие актуальные требования для специалиста data science?

    Maksim_64
    @Maksim_64
    Data Analyst
    чтобы были шансы на рассмотрение резюме?

    Это не про знания и навыки, а про количество опыта в резюме, процентов на 95. Остальные 5, проект в резюме.

    По скилам:
    1. Английский

    2. Бесплатная книга от создателя pandas https://wesmckinney.com/book/ она познакомит с экосистемой для классического ML (если совсем новичок, лучшая точка для старта)

    3. для классического ML стека, книга (доступна бесплатно) от профессоров стенфорда + довольно сложные упражнения. https://www.statlearning.com/

    4. Для нейронных сетей, нет ничего лучше чем Deep Learning with Python, Second Edition by François Chollet уникальная книга, никогда и нигде не видел объяснения продвинутых концепций столь простым языком, даже за пределами нейронных сетей.

    5. Рекомендация от меня, освой dash + plotly возвращаясь к шансам на рассмотрение резюме, создай dash ML приложение, задеплой его и размести ссылку на него в резюме, это повысит шансы.
    Ответ написан
    Комментировать
  • Как нарисовать ёлку вложенным циклом?

    Maksim_64
    @Maksim_64
    Data Analyst
    height = int(input('Введите высоту '))
    for i in range(1,height+1):
        print(f'{"#"*(i*2-1):^{height * 2}}')
    Ответ написан
    Комментировать
  • Какой курс лучше для начала работы бизнес-аналитиком?

    Maksim_64
    @Maksim_64
    Data Analyst
    Вопросы: как мне уйти в бизнес-анализ?


    Первое на рынке труда, под данной позицией понимается, все что "захотелось, пониматься под бизнес аналитикой", конкретному работодателю. Если мы окунемся в теорию, очень упрощенно, то можно выделить два больших направления.

    Анализ прошлого этим в теории и должны заниматься бизнес-аналитик, его задача на основе прошлых данных дать понимание, как все работает.

    Прогнозирование будущего этим занимаются другие специалисты в зависимости от используемых инструментов.

    Какие курсы помогут мне получить знания/навыки для первого оффера?


    Курсы не котируются в IT все виды аналитиков, крайне сложны для входа, обычно действующий специалист, меняет направление.

    Насколько важно для трудоустройства техническое образование?


    Важно умение мыслить, как программист | аналитик | и т.д. Подобное мышление может быть заложено техническим образованием, а может быть и нет. Что значит мышление? Умение сводить проблему к математическому виду (для аналитиков), сама корочка играет незначительную роль.
    Ответ написан
    4 комментария
  • Почему возникает ошибка "length mismatch: expected axis has 3 elements, new values have 4 elements"?

    Maksim_64
    @Maksim_64
    Data Analyst
    мне вот интересно, это задания с курсов каких то безумных? Никто в реале не будет писать функции rename_columns или fillna_values. Реально, если это с курсов это ну совсем не куда не годится.

    Что касается этого безумного кода.

    исходный фрейм у тебя имеет 5 на самом деле 3 колонки, о чем и сказано в ошибке колонок а ты пытаешься установить, 4 вот в этой строке
    test_df.columns = ['Shop_1', 'Shop_2', 'Shop_3', 'Shop_4']

    пример того безумия, что происходит
    df = pd.DataFrame({
        'A':[1,2,3],
        'B':[4,5,6],
        'C':[6,7,8]
    })
    df.columns = ['AA','BB']
    Ответ написан
  • Как правильно тренировать навык аудирования в английском?

    Maksim_64
    @Maksim_64
    Data Analyst
    Ну вот смотри, я свободно говорю (коммуникация в англоязычных командах не вызывает никакого стресса) и пониманию английский, учился сам.

    1. Если бы меня попросили дать худший совет по улучшению различных навыков английского, то я бы сказал английский по сериалам.

    2. Начинать надо с историй есть простые истории типо English with stories, и добиваться полного их понимания, тренироваться пересказывать в слух на английском.

    3. Просто потреблять как можно английского контента, какие то блогеры говорят на английском, не обязательно обучающие английскому, просто по интересующей тебя тематике и т.д. Надо построить базу. Сейчас кстати c chatGPT можно пообщаться не много на английском.

    По итогу: Не надо пытаться like a native, это доступно тем кто проживает в англо-говорящей среде плюс старайся прокачивать навыки (а не навык), послушал поговорил сам с собой, важно повторять услышанное.
    Ответ написан
  • Существуют ли эталонно красиво написанные программы?

    Maksim_64
    @Maksim_64
    Data Analyst
    "Качественный код" - весьма размытое понятие. Есть код удовлетворяющий требованиям, где-то важна архитектура, где то алгоритмы, где то и то и другое, а где то надо быстрее выдать MVP, и качество кода не важно до поры до времени.
    Книги + личный опыт лучшее место.
    Ответ написан
    Комментировать
  • Что прочитать или как разобраться(грубо говоря с чего начать)?

    Maksim_64
    @Maksim_64
    Data Analyst
    Ищи все что связанно с transformers (архитектура deep learning).

    Взаимосвязь между словами это их тема и именно она позволила создать LLM, это именно, тогда был прорыв.

    Связь между словами именуется контекст. До трансформеров было например так это дополнительно зависит от архитектурного решения, что считать токеном: слово, предложение и т.д. То есть например 'Мама мыла раму', 'Мне нужно новую раму на велосипед', или что-нибудь из подвортни 'Керя ты в раму въехал'. слово 'раму' будет иметь один и тот же эмбеддинг. Так было раньше.

    Трансформеры это революция они процессируют токен паралельно, и на каждом своем слое потенциально возможно обновления эмбединга слова 'раму', как и других слов. Тем самым они начали понимать контекст, иными словами эмбеддинги базируется на контексте, а не на слове.

    В общем это ответ на оба вопроса. Гугли читай статьи изучай и пробуй transformers.
    Ответ написан
    4 комментария
  • Почему не получается сохранять графики plotly как картинки?

    Maksim_64
    @Maksim_64
    Data Analyst
    1. Код показывай что ты там делаешь.
    2. попробуй конвертировать datetime (столбец с временем) в строку.
    Ответ написан
    1 комментарий
  • Как убрать/перенести приложения установленные в conda venv по ошибке или как удалить/очистить base среду в conda?

    Maksim_64
    @Maksim_64
    Data Analyst
    в чем проблема сделать conda deactivate и затем remove (если он позволит удалить базовый). А в чем смысл создай другой активируй да и все.
    Ответ написан
    4 комментария
  • Как мне в Python добавить таблицу, учитывая формулу?

    Maksim_64
    @Maksim_64
    Data Analyst
    Совершенно непонятно формулируешь вопрос.

    1. Кого считать соседями? Если пункт А находится в радиусе или на расстоянии R от пункта B, то они соседи.

    2. Земля не плоская, твоя формула евклидовой дистанции при чем здесь? для расчета дистанций есть другие специальные формулы.

    3.
    Как мне в Python добавить таблицу, которая дублирует первую таблицу, добавляет данные из второй таблицы, учитывая формулу выше.
    Реляционные операции они происходят на основе ключа или ключей. На основании чего ты тут собрался собирать. Ты можешь найти потенциально соседей для любой взятой точки. Возникает вопрос а зачем тогда вообще две таблицы их можно просто слить в одну. Возможно связь есть, а ты о ней не рассказал.

    4. По итогу из того что есть задача видится как нахождения соседей для каждой точки датасета. Я бы брут форсем, такое не решал, а использовал бы базы с approximate nearest neighbor. Построить индексы O(n log(n)), запросы O(log(n) ), ну и вся задача для каждой точки датасета O(n log(n)).

    5. Используй подходящие базы ну или хотя бы geopandas. В этих случаях все инструменты уже есть.
    Ответ написан
    8 комментариев