@iliyaisd

Как заставить работать tsfresh?

Подскажите пожалуйста, я пытаюсь использовать библиотеку для вытаскивания данных из временных рядов:
https://tsfresh.readthedocs.io

Она должна работать примерно так:
df = pd.read_csv("file.csv")
df.set_index('dateTimeAsString')
y = df.loc[:,'correctBooleanAnswer']
features_filtered_direct = extract_relevant_features(df.drop(['correctBooleanAnswer'], axis=1), y,
                                                     column_id='dateTimeAsString', column_sort='dateTimeAsString')

По параметрам df должно быть DataFrame, y - Series.
dateTimeAsString содержит строки с датами и временем, но только часы (без минут и секунд).
При запуске получаю:

ValueError: The following ids are in the time series container but are missing in y: {'2019-03-08 16', '2019-01-18 03', '2019-04-18 15', '2019-01-23 09'

Что я делаю не так? Спасибо.
  • Вопрос задан
  • 381 просмотр
Пригласить эксперта
Ответы на вопрос 1
LaRN
@LaRN
Senior Developer
Можно явно указать как требуется парсить дату-время:

df = pd.read_csv('file.csv', parse_dates=['datetime'])
Ответ написан
Комментировать
Ваш ответ на вопрос

Войдите, чтобы написать ответ

Войти через центр авторизации
Похожие вопросы