Ответы пользователя Максим Припадчев

Почему else игнорирует существование if?

Максим Припадчев @Maksim_64

ML Engineer

Проблема в типах данных cofe и flor - строки, а должны быть int.

cofe = int(input('Сколько вы хотите кофе?: '))
flor = int(input('Введите на каком вы этаже:'))

Исключения не выходит из-за логического and if cofe in [1, 2, 3] and flor >= 100: он оценивает первое условие как False и не переходит ко второму.

Ответ написан более года назад

1 комментарий

Стоит ли идти на практику в компанию?

Максим Припадчев @Maksim_64

ML Engineer

Совместить плюсы первого и второго варианта. Идти на стажировку и развиваться самому. Улучшением текущих и получением новых навыков, занимаются и уже работающие опытные специалисты, а у тебя все еще впереди. Зовут в какую то компанию иди, уйти можно всегда, плохо когда никуда не зовут.

Ответ написан более года назад

Комментировать

Как хранить данные таблицы содержащие описание множества товаров без ошибки "ValueError: All arrays must be of the same length"?

Максим Припадчев @Maksim_64

ML Engineer

Все очень просто, когда ты пытаешься создать фрейм, у тебя списки разной длинны получаются. Вот код который выдаст точно такую же ошибку.

(
    pd.DataFrame({
        'A':[1,2,3],
        'B':[100,200]
    })
)

А вот исправленная версия кода

(
    pd.DataFrame({
        'A':pd.Series([1,2,3]),
        'B':pd.Series([100,200])
    })
)

Не достающий элемент он заполнит пропущенным значением.

Ответ написан более года назад

1 комментарий

Как настроить del в python?

Максим Припадчев @Maksim_64

ML Engineer

Ну класс чуть переделать желательно бы. У тебя аргументы хранятся как кортеж (не мутабельный объект). Сменить для начала на список (мутабельный тип), и затем определить подходящий дандер метод. Например как то так.

class MyClass():
    def __init__(self, *args):
        self.args = list(args)  

    def __delitem__(self, key):
        if key in self.args:
            self.args.remove(key)

example = MyClass('ab', '12', 100, None)
print(example.args)
del example['12']
print(example.args)

Ну и там покрыть исключением если ключа нет и т.д.

Ответ написан более года назад

1 комментарий

Как узнать какое будет следующее число?

Максим Припадчев @Maksim_64

ML Engineer

"Справедливая" фифти/фифти монетка подброшена 4 раза, так получилось, что все 4 раза выпал орел. Что же будет, при 5 броске? все также фифти/фифти. То что было "до" никак не влияет на вероятность "следующего" события.

В казино и прочих ситуациях где имеют место повторяющееся события без изменения пространства выборки уместно говорить об ожидаемой величине и конвергенции (схождению практической ожидаемой величине к теоретической). Но не как не о "следующем" событие, оно не зависимо от прошлого.

Ответ написан более года назад

Комментировать

Как отфильтровать массив столбца датафрейма Pandas без выноса их в отдельный столбец?

Максим Припадчев @Maksim_64

ML Engineer

Решений миллион.
1. написать функцию для работы с питон списком, которая будет будет возвращать, True,False.
2. Применить один из многочисленных методов фильтрации.

Например

df = pd.DataFrame({
    'userID':[25,188,79],   
    'goalsID':[[1,2,4,5],[3,6],[1,9]]
})
(
    df.loc[lambda x:x['goalsID'].apply(lambda x: 3 in x)]
)

Ответ написан более года назад

13 комментариев

Как преобразовать тип данных столбца в Pandas?

Максим Припадчев @Maksim_64

ML Engineer

Преобразование типов здесь не при чем.

вот здесь ты print(df[['market_cap'] > 0])
Ты выполняешь операцию не с массивом а со списком. Списки ['market_cap'] > 0 такого не поддерживают. Если ты хотел выбрать подсет фрейма где капитализация больше нуля то пропустил df еще один.

print(df[df['market_cap'] > 0])

Ответ написан более года назад

1 комментарий

Как предсказать отработку сетапа на бирже?

Максим Припадчев @Maksim_64

ML Engineer

Это задача на классификацию?

Да. Так как у тебя таргет дискретный [Стоплосс, Профит, Безубыток,Таймаут]

Как подойти к задаче?

брать и делать, так появятся более конкретные вопросы. Если абстрактно, нейронная сеть это механизм трансоформации данных, у тебя есть входные данные вложенный массив, на языке математики тензоры определенного порядка, если геометрические трансформации например скалярное произведение матриц (тензоров второго порядка), есть желаемый результат вектор из 4 значений которые можно интерпретировать как вероятности, есть функции потерь которые сравнивает "некая трансформация данных" была полезна уменьшила функцию потерь или нет, есть механизм настройки матрицы весов который позволяет понимать как увелечение или уменьшение определенного значения внутри вектора отражается на функции потерь.

Какие слои и структуры?

Рекурентная нейронная сеть, функция активации relu, кроме последнего слоя там softmax или что типа того что бы можно трансформировать вывод в вектор вероятностей.

Для обучения планирую скармливать нейронке например 1000

Без понятия тюнинг гиперпараметров, а batch size это один из параметров которые тюнятся, делаются после с наблюдением поведения других метрик на тренировочном и тестовом сете.

Надо ли как то предобрабатывать эти свечки или можно скармливать как есть OHLCV?

Надо препроцессинг для time series необходим их много гугли, но однозначно надо.

Ответ написан более года назад

Комментировать

Как узнать, что диапазон находится в пределах нормы отклонений?

Максим Припадчев @Maksim_64

ML Engineer

Колебаний относительно чего? пусть будет некое число x0. pandas псевдокод будет такой
s - Series с временными диапазонами
x0 - относительно чего колебания
((x0 - s).abs() <= 3).mean() * 100 Это количество в процентом отношении значений которые отклоняются от x0 в пределах +-3 секунд

Ответ написан более года назад

Комментировать

Как исправить: TypeError: bad operand type for unary ~: 'type'?

Максим Припадчев @Maksim_64

ML Engineer

Применяешь где то оператор ~ к типу который не поддерживает его.
Либо ты в том месте ожидаешь другой тип, данных, ну либо попробуй заменить битовое отрицание, на логическое not (глупость, в комментарии меня поправил Vindicar ). ~ - инвертирует побитовое представление числа, в случае если специальным методам он не был переопределен для кастомных объектов. not- делает bool и затем инвертирует значение.

Ответ написан более года назад

4 комментария

Почему предсказания дерева решений не совпадает с ожиданием?

Максим Припадчев @Maksim_64

ML Engineer

А почему ты решил, что вероятности должны совпадать с твоей реализацией.
predict_proba из scikit-learn не в коем случае не считает вероятности а калибрует их. И он вполне может это делать плохо.

DecisionTreeClassifier в принципе не является детерминистическим, результаты могут отличаться (не обязательно, но могут.

Ответ написан более года назад

1 комментарий

Как стартовать в аналитике "гуманитарию"?

Максим Припадчев @Maksim_64

ML Engineer

Все "узкие" позиции для входа в IT это всегда тяжело. На такие специализации, как правило нет джунов или к ним требования и опыт и все остальное.

1. Английский
2. Python
3. статистика, теория вероятности, ML стек в python.
4. Учится по книгам.
5. Пробоваться всюду, работу своей мечты потом, найдешь, спустя годы.

Ответ написан более года назад

2 комментария

Как решить проблему с could not convert string to float?

Максим Припадчев @Maksim_64

ML Engineer

Что значит не обрабатываешь, вот
print(df.replace('?',np.nan).astype(float) Здесь во все фрейме делаешь замену а потом весь фрейм пытаешься привести к типу данных float.

Работай с "числовым подсетом датафрейма".
или заведи отдельную переменную приведи подсет к флоатам и потом группируй. Типа такого

df_ = df.loc[:,[nuimeric_column1,numrec_column2]] = df.loc[:,[nuimeric_column1,numrec_column2]].replace('?',np.NaN).astype(float)

и затем группируй и т.д.

Или хочешь чейнить, используй assign рассматривай все колонки по отдельности, при сложныех манипуляциях, которые требуют индивидулаьного подхода, к каждой колонке по отдельности так делают.

(
    df.assign(
        numeric1=lambda x: x['numeric1'].replace('?',np.NaN).astype(float),
        numeric2=lambda x: x['numeric2'].replace('?',np.NaN).astype(float)
    )
    .groupby('Category')
    .agg(['mean','median'])  
)

Ответ написан более года назад

Комментировать

Нейронные сети - как правильно подсчитать производную функции?

Максим Припадчев @Maksim_64

ML Engineer

Статьи не смотрел. Производную ты посчитал верно.

На графике ошибка. Нету в этой точке такого значения производной. Градиентный спуск это про оптимизации нахождение минимумов или максимумов. Если использовать формулу аппроксимации, f(x0)' = (f(x0) - f(x0-h)) / h, где h - это маленький шаг, то в зависимости от того на сколько он мал, мы будем стремится к значению -2.01.
По этому откуда там -7 я понятия не имею.

Ответ написан более года назад

Комментировать

Вложенный class (в котором функции) в другой class не видит self?

Максим Припадчев @Maksim_64

ML Engineer

Есть методы экземпляра а есть методы класса. Не могу представить не одного полезного применения такой конструкции но формально вот так.

class A:
    def __init__(self):
        self.test = 'test'
    class B:
        @classmethod
        def test(self):
            return A().test
print(A().B.test())

Но код совершенно, бесполезный, точнее сказать абсурдный лучше бы ты привел простенький пример, что ты пытаешься сделать, было бы больше толку.

Ответ написан более года назад

3 комментария

Jupiter lab (Jupiter notebook) это изолированная среда или нет?

Максим Припадчев @Maksim_64

ML Engineer

Могут в изолированной могут в общей, это все равно что спросить я пишу код в vscode куда будут устанавливаться пакеты.

Если ты ставил анаконду то по умолчанию создается base окружение которое опять таки по умолчанию активировано и установка происходит в него. Если ты просто установил jupyter notebook то он может быть запущен в том числе и на "default"ом python.

Ответ написан более года назад

2 комментария

Неочевидное поведение расчетов на Python pandas, как такое получается?

Максим Припадчев @Maksim_64

ML Engineer

x - значение ячейки в лямбде, то есть (x*q1/q0) это выполняется для каждого значения a2, где x - это каждое значение a2. (синий кейс) Во втором же случае нормальная замена на 95 квантиль любого значения ячейки а2 которое больше 95 квантиля. (красный кейс)

Ответ написан более года назад

1 комментарий

Является ли жизненно необходимым пройти курсы по бизнес-анализу для того чтобы достичь уровня стажера?

Максим Припадчев @Maksim_64

ML Engineer

1. Корреляция между пройденными курсами и трудоустройствам чуть больше нуля, и то только потому что корреляция еще не означает причинно следственную связь. Знаменитый учебный пример на эту тему корреляция между продажами мороженного и нападением акул, на одном из пляжей, с ростом продаж мороженного акулы нападали чаще, естественно два этих события не как не связаны между собой, просто сезон купаний акулы нападают чаще и мороженое покупают чаще.

Так и с курсами человек может интересоваться IT пройти курсы и потом получить работу и думать что между курсами и трудоустройством есть причинно следственная связь. Но он получил бы ее и без них.

2. Все что всякая аналитика особенно без хард скилов (программирование) начальный уровень, крайне тяжело зайти, серьезная доля рынка это те кто внутри IT переходит в это направление, а на них смотрят по другому.

Ответ написан более года назад

Комментировать

Как исправить код?

Максим Припадчев @Maksim_64

ML Engineer

Ты пытаешься делать выборку среза с заполнением. new_arr = arr[1:-3, 4:-2] = arr1 глупость, это так не работает.

arr = np.ones((10,10), dtype = np.int8)  
new_arr = arr.copy()
new_arr[0, :] = 0                   
new_arr[:, :4] = 0                  
new_arr[:, -2:] = 0                 
new_arr[-3:, :] = 0                 
print(new_arr)

Или если хочешь короче я исходил из твоего кода, то можно вот так.

new_arr = np.zeros((10, 10))
new_arr[1:7, 4:-2] = 1

Так короче, и правильнее но мы не много нарушаем условие задачи. Мы заполняем единицами выбранный срез.

Ответ написан более года назад

Комментировать

Где вы берете статистические данные?

Максим Припадчев @Maksim_64

ML Engineer

Специалист который занимается, ответами на данный вопрос называется продуктовый аналитик. Основная их работа это выдвижение гипотез в условиях недостаточности данных. Иными словами сведение к математическому виду определенного утверждения.

Все твои вопросы не являются общедоступной информацией, это знает владелец продукта, иногда он может сделать эту информацию публичной, иногда нет. Другой способ, это простое проведение опросов, и оценка интересующей статистики на основе случайных выборок.

Ответ написан более года назад

Комментировать

Войдите на сайт