Фрилансер
Контакты
Местоположение
Камбоджа, Камбоджа

Достижения

Все достижения (8)

Наибольший вклад в теги

Все теги (87)

Лучшие ответы пользователя

Все ответы (303)
  • Как разобраться в машинном обучении на питоне?

    LazyTalent
    @LazyTalent
    Data Engineer, Freelancer
    Если в кратце то:
    1. Дб корпус текстов с лейблами (например, позитивный твит, негативный твит)
    2. Удаляешь знаки препинаия
    3. Удаляешь стоп слова (предлоги и пр. не имеющее смысловой нагрузки)
    4. Делаешь стемминг
    5. Из каждого твита делаешь набор н-грамм
    6. Из н-грамм делаешь TF-IDF словарь
    7. Сплитишь полученный словарь на данные для обучения и данные для тестов
    8. Засовываешь все это в понравившийся алгоритм для МЛ, например, так:
    clf = RandomForestClassifier(n_jobs=-1)
    clf.fit(X_train, y_train)

    9. Сохраняешь полученную модель в пикл и потом уже используешь ее для текстов, которые необходимо классифицировать.
    predict = clf.predict(tfidf_predict.toarray())
    Ответ написан
    3 комментария
  • Для чего нужен random.seed(x) python?

    LazyTalent
    @LazyTalent
    Data Engineer, Freelancer
    Все дело в том, что в Питоне, как и в любом другом языке, используется т.н. генератор псевдо случайных чисел. Т.е. random выдает не случайное число, а число которое вычисляется алгоритмом на осное другого числа, по умолчанию это текущее время. random.seed позволяет изменить число, которое передается в random для генерации случайного числа, а т.к. "случайные" числа выдаются одним и тем же алгоритмом, то при одинаковом параметре в random.seed будут и одинаковые "случайные" числа.
    >>> import random
    >>> ['%.2f' % random.random() for i in range(10)]
    ['0.21', '0.66', '0.18', '0.48', '0.86', '0.46', '0.48', '0.04', '0.67', '0.37']
    >>> 
    >>> ['%.2f' % random.random() for i in range(10)]
    ['0.90', '0.68', '0.02', '0.90', '0.63', '0.06', '0.22', '0.14', '0.97', '0.68']
    >>> 
    >>> random.seed(5)
    >>> ['%.2f' % random.random() for i in range(10)]
    ['0.62', '0.74', '0.80', '0.94', '0.74', '0.92', '0.03', '0.47', '0.94', '0.65']
    >>> 
    >>> random.seed(5)
    >>> ['%.2f' % random.random() for i in range(10)]
    ['0.62', '0.74', '0.80', '0.94', '0.74', '0.92', '0.03', '0.47', '0.94', '0.65']
    Ответ написан
    4 комментария
  • ML: стоит ли начинаать?

    LazyTalent
    @LazyTalent
    Data Engineer, Freelancer
    Ответ написан
    Комментировать
  • Путь к phpstorm Linux Ubuntu 18.04?

    LazyTalent
    @LazyTalent
    Data Engineer, Freelancer
    1. Запускаешь шторм
    2. Tools -> Create Command-line Launcher
    3. Появиться диалоговое окно с путём
    4. Копируешь путь
    5. Жмеёшь OK
    Ответ написан
    Комментировать
  • Возможно ли заполнить веб форму в браузере используя python?

    LazyTalent
    @LazyTalent
    Data Engineer, Freelancer
    Читать selenium
    from selenium import webdriver
    
    driver = webdriver.Chrome()
    driver.get('http://...')
    field = driver.find_element_by_tag_name('input')
    field.send_keys('blabla')
    driver.quit()
    Ответ написан
    Комментировать

Лучшие вопросы пользователя

Все вопросы (17)