Подскажите пожалуйста, я пытаюсь использовать библиотеку для вытаскивания данных из временных рядов:
https://tsfresh.readthedocs.io
Она должна работать примерно так:
df = pd.read_csv("file.csv")
df.set_index('dateTimeAsString')
y = df.loc[:,'correctBooleanAnswer']
features_filtered_direct = extract_relevant_features(df.drop(['correctBooleanAnswer'], axis=1), y,
column_id='dateTimeAsString', column_sort='dateTimeAsString')
По параметрам df должно быть DataFrame, y - Series.
dateTimeAsString содержит строки с датами и временем, но только часы (без минут и секунд).
При запуске получаю:
ValueError: The following ids are in the time series container but are missing in y: {'2019-03-08 16', '2019-01-18 03', '2019-04-18 15', '2019-01-23 09'
Что я делаю не так? Спасибо.