{float(value) * 100}
и все. Там он еще float, потом он будет отформатирован и станет частью строки. нет такого что вместе с ними есть НЕ отмененные (их нет) - это группа А (контрольная)А одно из основных правил для выполнения ztest для двух пропорций это
np > 5 AND n(1-p) > 5
list = [n for n in range(1, 31)]
list2 = [n for n in range(1, 31)]
вот это говорит о том что с python вы едва знакомы. Как результат ищите кусочки кода копируете их пытаетесь так учится. Вы попросту теряете время. Учитесь нормально, не забегая вперед. Иначе не будет прогресса а одни иллюзии. def read_csv():
with open('urls.txt', encoding='utf-8') as file:
reader = csv.reader(file) #
data = list(reader)
flat_list = [item for sublist in data for item in sublist]
return flat_list
def url(): # парсинг карточек товаров из файла url.txt
flat_list = read_csv()
picture_links = []
for url in flat_list:
time.sleep(2)
html = get_html(url)
picture_links.append(get_page_data(html))
return picture_links
result = url()
import time
picture_links = []
for url in flat_list:
time.sleep(2)
html = get_html(url)
picture_links.append(get_data(html))
picture_links = []
for url in flat_list:
html = get_html(url)
picture_links.append(get_data(html))
И так есть ДАННЫЕ мы их разбили на тренировочный сет и тестовом сет И на тренировочном и на тестовом сете мы можем иметь очень высокую точность. Что не означает что модель будет работать в продакшене, почему можно осуществить утечку тестового сета во время тюнинга гиперпараметров или во время кросс валидации. И вот у нас есть условная точность в 95 процентов а на деле модель в продакшене посыпется.
По этому НАСТОЯЩИЙ ТЕСТОВЫЙ СЕТ заказчик вообще тебе не должен предоставлять. Соответственно, что значит 80% процентов или 90 процентов %. Без продакшена? Без бизнеса который сформировал задачу, друг мне надо 75% например, вот данные дели их там тестовый тренировочный, что хочешь делай настоящий тестовый сет у меня и тебе я его не дам вообще, сделаешь больше будет тебе премия.
Почему так что такое Обучение модели (простенько поговорим нам тут больше и надо):
Есть входные данные X в какой то форме скажем матрица например.
Есть Цель назовем его y - что то распознать
Есть функция f - которая определяет НАСТОЯЩИЕ отношения между X и y (мы ее не найдем)
есть наша функция f_estimator - это наша модель которая сопоставит X и y.
и есть ошибка error назовем ее E.
Итого имеем y = f_estimate(X) + E
E в свою очередь делится на две. редуцируемую ошибку и не редуцируемую, так вот цель машинного обучения это МИНИМИЗАЦИЯ редуцируемую ошибки, а к не редуцируемой оно не имеет никакого отношения, Она остается. От чего она зависит? Например какой подсет от данных ты получил от общего.
У тебя там ниже куча условий, откуда ты знаешь, что все они будут всегда выполняться на все сто, какого влияние освещения на фото, и т.д. и т.д.
По этому как обещал разочарую. К ответу добавить особо нечего. Это бизнес задача приносит ли выгоду твоя модель или нет? И в какой интервале должна лежать точность чтобы это имело смысл вводить такую модель.