df = pd.DataFrame({
'urls':['123.ru','lalala.ru','lalala.ru/qwe','lalala.ru/12rwse','bebe.ru'],
'other data':[1,1,1,1,1]
})
# Первый способ
new_df = df.loc[df['urls'].str.split('/').str[0].drop_duplicates().index]
print(new_df)
# Второй способ
new_df = df[~df['urls'].str.contains('/')].drop_duplicates()
print(new_df)
df = pd.DataFrame({
'urls':['http://123.ru/','http://lalala.ru','http://lalala.ru/qwe',
'http://lalala.ru/12rwse','http://bebe.ru'],
'other data':[1,1,1,1,1]
})
new_df = df.loc[df['urls'].str.split('//').str[1].str.split('/').str[0].drop_duplicates().index]
print(new_df)
plt.scatter(up[up.event == 0].index , up[up.event == 0].low, marker='^',color='green')
plt.scatter(up[up.event == 1].index, up[up.event == 1].high, marker='v',color='red')
plt.scatter(down[down.event == 0].index, down[down.event == 0].low, marker='^',color='green')
plt.scatter(down[down.event == 1].index, down[down.event == 1].high, marker='v',color='red')
shapka = {'Кадастровый № ОКС':[],'Вид ОКС':[],'Назначение':[],'Адрес ОКС':[],'Площадь':[],'Вид права':[],'ФИО':[],'Номер рег. записи':[]}
df = pd.DataFrame(shapka)
slovar = {'Кадастровый № ОКС': 'тут текст', 'Вид ОКС': 'тут текст', 'Назначение': 'тут текст', 'Адрес ОКС': 'тут текст', 'Площадь': 'тут текст', 'Вид права': 'тут текст', 'ФИО': 'тут текст', 'Номер рег. записи': 'тут текст'}
new_df = pd.concat([df, pd.DataFrame.from_records([slovar])] ,ignore_index=True)
d1 = {'A':1,'B':2}
d2 = {'A':3,'B':4}
df = pd.DataFrame.from_records([d1,d2])
print(df)
if flag is True:
к вот этому условию тут все просто думаю комментарии излишне.n != 0:
Если оно истинно то выполняется то что в теле цикла, ну а если ложно то выполнится else.n != 0:
перестало быть истинно (или не было изначально истинно) выполнится else. regions = ['Томская область', 'Московская область', 'Ленинградская область']
cities = ['Томск', 'Москва', 'Санкт-Петербург']
pop = [1051, 8594, 2027]
for region, city, population in zip(regions, cities, pop):
print(f'{region}: столица {city}, население {population} тыс. человек')
for vivod in city.split():
if vivod.startswith('G') and int(city.strip().replace('\\','').split(" ")[-1])>500000:
print(vivod)
metrics_df[[
"same_intervals_between_requests"
df[["time_local", "id_session"]].groupby("id_session").apply(count_metric_using_shift)
df = pd.DataFrame({
'Cat':['A','A','B','A','B'],
'Num1':[1,2,3,4,5],
'Num2':[6,7,8,9,10]
})
df[['A','B']] = df[['Cat']].groupby('Cat').apply('mean')
df= pd.DataFrame({'time':pd.date_range('2023-03-22', periods=48, freq='H')})
bins = [0,5,11,16,22,24]
labels = ['Ночь', 'Утро','День','Вечер','Ночь']
df['session'] = pd.cut(df['time'].dt.hour, bins=bins, labels=labels, include_lowest=True,ordered=False)
df
df[df.name.str.contains('i3|oem', regex=True, case=False)])
df = pd.DataFrame({
'name':['23i3f','dOemf','25','s2f5','df5'],
'amount':[1,2,3,4,5]
})
print(df[df.name.str.contains('i3|oem',regex=True,flags=re.IGNORECASE)])
import pandas as pd
df = pd.DataFrame(data)
df.to_csv('file.csv')
Гуглил, находил информацию только уже через собранные данные в словаре/массиве, а не циклично дописывались постоянноНу так правильно у данных должна быть структура соответствующая что бы в excel писалось по столбцам. еще удобнее это создавать новый pandas фрейм в цикле (для каждых новых данных) и добавлять через него в excel. У него есть метод to_excel у него есть параметр mode там можно поставить 'a' что бы файл не перезаписывался а строки добавлялись туда, а также параметр header его можно поставить в False что бы имена столбцов не писались и других куча что бы проблем не возникло. Примеров документация статьи в интернете.
Features, предоставленные мне для этой задачи, как я уже написал, обезличенные, поэтому они все нужные
Мне нужно построить модель, которая будет предсказывать будущий статус.Что значит будущий речь идет о временной последовательности, а не о классической классификации?. Тогда препроцессинг должен быть сделан совершенно другой начиная от сплитов и т.д. В таком случае все данные нужно агрегировать разными функциями в пределах окна и на них учить, обязательно это проясните.