• Почему выводит положительные числа?

    1esman, Вы не тот файл запускаете это не результат исполнения кода который вы опубликовали.
  • Как цифру в строке преобразовать в числовой формат?

    pitonessa,
    result = {key: float(value) for key, value in d.items()}

    затем
    timedelta(**result)
  • Как цифру в строке преобразовать в числовой формат?

    pitonessa, В рамках вашего кода ваш вопрос не имеет смысла, поскольку вы формируете строку. строка может содержать в себе только один тип данных str. Если вам нужен float для операций например умножить на 100.
    {float(value) * 100} и все. Там он еще float, потом он будет отформатирован и станет частью строки.
  • Какой тут критерий подойдет для аб тестирования?

    dmshar, Ну я бы не стал. У нас заведомо в контролем сете вероятность успеха 0.
    нет такого что вместе с ними есть НЕ отмененные (их нет) - это группа А (контрольная)
    А одно из основных правил для выполнения ztest для двух пропорций это
    np > 5 AND n(1-p) > 5
    В данном случае у нас нарушение от слова совсем n*p = 0 или (1-p) = 0 в зависимости от того что мы обозначим за успех и как следствие вероятность успеха.

    Фишер тест nonparametric тест, нам не нужно знать дистрибуцию популяции. И плюс нет вышеуказанного требования. Если бы не 0 в контрольном сете я бы сам использовал ztest он куда проще чем тест Фишера.
  • Как обратиться к данным из csv таблицы?

    Роман Романов, будьте внимательны я специально привел read_csv() без этого аргумента, потому что он там не нужен. Обратите внимание на функцию read_csv(), в ее тело внесены изменения и в ее объявление тоже аргумента data там нет.
  • Какой алгоритм лучше подходит для определения прибыльной сделки на бирже?

    Kind_Man, Например, большинство алгоритмов будут работать лучше если данные нормализованы, ваш X (только числовая ее часть) я сейчас о нем говорю. Что значит нормализовать. Каждая ваша переменная имеет mean=0 и std=1. Как этого добиться (x - x.mean()) / x.std(), для каждой переменной, можете использовать StandardScaler из sklearn. Все переменные которые относятся к разраду категории закодированы правильно. Например KNeighborsClassifier очень зависим от того нормализованы ли данные или нет. Все что я сейчас рассказал это мизер, Основная работа data science это приведение данных к виду на котором алгоритм будет работать хорошо, когда это сделано тогда и надо тюнить. Тюнить значит подкрутить настройки, на каких он будет работать оптимально это потом. Подготовка данных это огромная и основная тема. Я вам тут не изложу всего.
  • Какой алгоритм лучше подходит для определения прибыльной сделки на бирже?

    Kind_Man, Смотрите, да оверфиттинг, что значит оверфиттинг - модель на все сто следует тренировочным данным, то есть найдена детерминистическая функция которая вход X сопоставляет с целью y. Как это понимать, нарисуйте на листе бумаге систему координат и нарисуйте несколько точек соедините их линий функция вашей линии это модель которой предстоит попросту экстраполировать будущие X которые она некогда не видела. Это безнадежно, Это упрощенный пример конечно, в вашем случае речь идет функции где графики мы рисовать не можем в силу того что нарисовать мы можем только три переменных, но принцип как понимать от этого не меняется.

    Цель же машинного обучения найти модель которая обобщит данные найдет в них некий паттерн, а не просто на все сто будет повторять тренировочный сет данных.

    Как исправить по кусочку кода я не подскажу и не ждите что кто то подскажет, это невозможно. Нужно видеть и работать с данными визуализировать их, смотреть метрики и много чего другого и только потом думать какой алгоритм и как применять.

    Я вам уже говорил, но вы не хотите слышать, сначала нужно понимать данные и привести их правильному виду потом алгоритмы. Вы сфокусировались на тюнинге и ждете результатов.

    И наконец подучите python
    list = [n for n in range(1, 31)]
    list2 = [n for n in range(1, 31)]
    вот это говорит о том что с python вы едва знакомы. Как результат ищите кусочки кода копируете их пытаетесь так учится. Вы попросту теряете время. Учитесь нормально, не забегая вперед. Иначе не будет прогресса а одни иллюзии.
  • Как обратиться к данным из csv таблицы?

    Роман Романов,
    def read_csv():
        with open('urls.txt', encoding='utf-8') as file:
            reader = csv.reader(file)  #
            data = list(reader)
            flat_list = [item for sublist in data for item in sublist]
        return flat_list
    
    
    def url():  # парсинг карточек товаров из файла url.txt
        flat_list = read_csv()
        picture_links = []
        for url in flat_list:
            time.sleep(2)
            html = get_html(url)
            picture_links.append(get_page_data(html))
        return picture_links
    result = url()

    Ну и ваша функция get_page_data опять ничего не возвращает испрвьте это.
    А вообще судя по коду вам совсем рано, зря тратите свое время вы не научитесь так нечему, пока изучайте основы языка (как работает функция, простейшие объекты и т.д) .
  • Как обратиться к данным из csv таблицы?

    Роман Романов, И да добавьте паузы между вызовами
    import time
    picture_links = []
    for url in flat_list:
        time.sleep(2)
        html = get_html(url)
        picture_links.append(get_data(html))

    Что бы не отправлять запрос на сервер слишком быстро каждый раз, он будет пару секунд брать паузу перед очередным запросом на сервер.
  • Как обратиться к данным из csv таблицы?

    Роман Романов, Ну тогда собственно создаем пустой список куда будем складывать ссылки на картинки, проходимся по нашему СПИСКУ из ФАЙЛА и записываем результаты в пустой список (потом можно отдельно в файл).
    picture_links = []
    for url in flat_list:
        html = get_html(url)
        picture_links.append(get_data(html))

    Все в вашем picture_links должны все ссылки на картинки.
  • Как обратиться к данным из csv таблицы?

    Роман Романов, Я кусочек кода привел, он сработает? для одной ссылки естественно.
  • Как обратиться к данным из csv таблицы?

    Роман Романов, Я даже уточную что вернет. Что будет в data?
    url = flat_list[0]
    html = get_html(url)
    data = get_data(html)
  • Как обратиться к данным из csv таблицы?

    Роман Романов, Отлично, последний вопрос перед тем как мы сдвинемся с мертвой точки. А что возвращает get_data в том кусочке кода что вы представили здесь в комментарии она не возвращает ничего. Наверно вы не полностью код представили это и необязательно, сколько значений она возвращает за один вызов?
  • Как обратиться к данным из csv таблицы?

    Роман Романов, так на сколько я понял это другая функция с таким же названием как в вопросу (те что в вопросе как раз таки создавали эти ссылки). Это как я понимаю должна парсить инфу с сылок которые в файле. Так?
  • Как обратиться к данным из csv таблицы?

    Роман Романов, У вас есть функция которая спарсит необходимую вам информация с одной из этих ссылок?
  • Как обратиться к данным из csv таблицы?

    вы свой csv видели там рабочие ссылки то что вы хотите туда добавить там уже есть.
    сюда надо подставить урлы по одному из файла csv
    в файле каждая ссылка вот так же начинается, добавите абсурд получится.
  • Какой алгоритм лучше подходит для определения прибыльной сделки на бирже?

    Kind_Man, Я бы не заморачивался. Вы имеете коллекцию классификаторов, он берет либо среднюю вероятность среди классификаторов, либо лучший предиктор. soft vote vs majority vote. Это все такие детали. Нужно тонну работы проделать с данными что бы все было правильно, составить несколько сценариев основываясь на источниках вариативности. И когда вот это все сделано. Ну можно попробовать, никакой фундаментальности в нем нет, или золотого правила используй VotingClassifier тоже нет. Может в самом конце имеет смысл а может и нет. Я бы работал с вводными данными (70 процентов времени) и только 30 с алгоритмами. И смотрел как и что работает. А от таких частностей я бы вообще не ждал каких то результатов.
  • Какой алгоритм лучше подходит для определения прибыльной сделки на бирже?

    Kind_Man, Я подразумеваю, что под применением нескольких алгоритмов, вы имеете ввиду построение нескольких моделей и сравнения их перфоманса. Если так то обычно в финансовом мире у вас не одна модель на все случаи жизни, а несколько приготовленных для разных сценариев, например главным фактором ценообразования являются новости, от новостей рынок может скакнуть на 20-30 процентов что вверх что вниз, ну какие тут деревья или бустинги они даже правильно натренированные будут плохо себя вести в следствии оверфитинга , что то по скромнее нужно . Иной сценарий рынок будет расти, в следующий год новостей которые вызывают скачки не будет (или вероятность из ничтожно мала), ну при таком сценарии можно и оверфитить. Вообще подводя итог, хотите развиваться в данном направлении. Х (данные на вход) - вот это вот самое главное, что бы нужные трансформации были сделаны, нужные данные добыты и ИСПОЛЬЗОВАНЫ В НУЖНЫЙ МОМЕНТ времени. Я могу ошибаться конечно, но у меня есть ощущение что вы сильно переоцениваете возможности алгоритмов и недооцениваете ПОДГОТОВКУ правильных данными. И мыслите сценариями vмодель НА ВСЕ СЛУЧАИ жизни это дело гиблое.
  • Как найти такой определенный интеграл?

    Айнур Низамов, Все вот оно и сложилось, вы большой молодец, я упусти момент что tan не является непрерывной функцией на интервале интегрирования и надо разбивать по интервалам, и интегрировать, вот так несколько лет не интегрировать в ручную и забыть про это. Сейчас все вспомнилось. Опубликуйте свой комментарий ответом и отметьте его решением. Будет очень полезно, всегда надо проверять на непрерывность.