• Удалять ли отрицательную корреляцию, если строишь линейную регрессию?

    Maksim_64
    @Maksim_64
    Data Analyst
    Конечно же нет, негативная корреляция нормальный результат. Когда одна переменная увеличивается другая уменьшается это негативная корреляция. В то время как позитивная корреляция это когда одна переменная увеличивается увеличивается и другая. Вот и вся разница между позитивной и негативной корреляцией.
    Ответ написан
    4 комментария
  • Как проверять что введен русский язык?

    Решил написать свой вариант такой функции, чтобы продемонстрировать её несовершенство. Вариант с флагом и только русскими буквами делать не стал, сделал с процентами. Третья проверка не проходит, тк русских букв слишком мало в соотношении с другими, хотя текст по сути русский. Но это скорее исключение, в целом такая функция имеет место быть, но лучше перестраховаться от разных вариантов.

    import string
    
    def is_russian(text):
        alpha = "абвгдеёжзиклмнопрстуфхцчшщъыьэюя"
        new_text = text.translate(str.maketrans('', '', string.punctuation)).lower().replace(' ', '')
        
        rulet = 0
        for letter in new_text:
            if letter in alpha:
                rulet += 1
         
        # Если больше или равно 70%       
        if rulet/len(new_text) >= 0.7:
            return(True)
        else:
            return(False)
        
    
    good_text = "Какой-то текст, со знаками препинания, конечно же, sorry!"
    bad_text = "Some english text, isn't russian."
    secret = "Люблю Gucci"
    
    print(is_russian(good_text)) #вернёт True
    print(is_russian(bad_text)) #вернёт False
    print(is_russian(secret)) #вернёт False
    Ответ написан
    4 комментария
  • Нужна ли математика в Data science?

    @alexalexes
    У каждой формулы есть граничные условия применения.
    Если входные данные будут неконсистентны для метода, где работает эта формула, будете получать #ЗНАЧ! (если это Excel) и ничего не поминать, почему так случилось.
    А со знаниями математики вы будете понимать:
    1. Как урезать данные, или заполнить участок, где получаете #ЗНАЧ!.
    2. Какие методы применить для автоматической оценки неконсистентности данных, чтобы ваш скрипт сам выявлял эти проблемы на конкретном типе выборки и делал корректировки.
    Ответ написан
    1 комментарий
  • Как записать данные в столбик в csv формате?

    Vindicar
    @Vindicar
    RTFM!
    file_writer.writerow([name, subscribers, type, price])

    Ну так ты просишь записать в одну строку, он и записывает в одну строку.
    file_writer.writerows(zip(name, subscribers, type, price))


    zip() превратит отдельные списки ([имя, имя, ...], [подписчики, подписчики, ...], [тип, тип, ...], [цена, цена, ...]) в последовательность значений ([имя, подписчики, тип, цена], [имя, подписчики, тип, цена], ...)
    Ответ написан
    1 комментарий
  • Что лучше использовать ИИ или готовые библиотеки?

    В случае, если ты с нуля попытаешься сделать ИИ для таких переводов, то тебе понадобится:
    1. Перегнать русский звук в текст
    2. Перевести текст
    3. Перевести английский текст в речь
    В идеале ещё подобрать интонации, скорость, и голос.

    Всё это крайне сложно, особенно для новичка, особенно в одиночку и без бюджетов большой корпорации.

    Так что если у тебя стоит задача, которую надо решить - советую взять какой-нибудь готовый сервис. Тот же Яндекс вроде как умеет в перевод речи в реальном времени. Цена вроде меньше рубля за минуту

    При помощи библиотек врядли получится такое решить, тк большинство крайне слабые и еле как распознают речь, не говоря уже о переводе. (Если мы говорим о библиотеках, которые все вычисления делают локально)

    насколько ИИ будет эффективнее?

    Исходя из того что вы ни разу до этого с подобными технологиями не работали, то эффективность ИИ будет отрицательной - потратите много времени на самостоятельное изучение темы, потратите кучу ресурсов компьютера, а в результате в лучшем случае получите эффективный обогреватель.
    Ответ написан
    1 комментарий