Как в pd.DataFrame комбинировать дату и время из разных столбцов?

Question

Дмитрий Темников @exibite777

Ведущий системный аналитик

Python

Как в pd.DataFrame комбинировать дату и время из разных столбцов?

Как на примере в этого кода скомбинировать дату и время из разных столбцов?

for SESSION_REPORT_FILE in os.listdir(SESSION_REPORT_PATH):
    start_date=datetime.strptime(SESSION_REPORT_FILE[14:len(SESSION_REPORT_FILE)-4], '%Y-%m-%d')
    fixed_df = pd.read_csv(SESSION_REPORT_PATH + SESSION_REPORT_FILE, sep=';', encoding='utf-8', engine='c', 
            names=['v2m_guid', 'start_time', 'text_length', 'voice_length'], parse_dates=['start_time', 'voice_length'], 
        dtype={'text_length': np.int32}, header=0)
    fixed_df["start_date"]=start_date
    fixed_df['start_time']=datetime.combine(fixed_df["start_date"].date(), fixed_df['start_time'].time())
    fixed_df['voice_length']=datetime.combine(fixed_df["start_date"].date(), fixed_df['voice_length'].time())-fixed_df["start_date"]
    fixed_df['end_time']=fixed_df['start_time']+fixed_df['voice_length']

Падает на строке

datetime.combine(fixed_df["start_date"].date(), fixed_df['start_time'].time())

, что логично, так как я вызываю функции datetime.combine, dateи time, относящиеся к элементам pd.Series к самому pd.Series. Но это казалось логичным, с учетом других кейсов Pandas, где это работает. Подскажите как корректно сделать задуманное, используя методы pd.Series? Использовать цикл совсем не хочетя, иначе теряется магия Pandas

UPDATE
Сделал так

pd.Timestamp.combine(fixed_df["start_date"].dt.date, fixed_df['start_time'].dt.time)
datetime.combine(fixed_df["start_date"].dt.date, fixed_df['start_time'].dt.time)

в обоих случаях получил

TypeError: combine() argument 1 must be datetime.date, not Series

, что наверное тоже логично. Какой аналог функции datetime.combine?

Вопрос задан более трёх лет назад
557 просмотров

Комментировать

Подписаться 2 Сложный Комментировать

Помогут разобраться в теме Все курсы

Нетология

Python-разработчик: расширенный курс + нейросети

12 месяцев

Далее
Академия Эдюсон

Python-разработчик + ИИ

9 месяцев

Далее
ProductStar × РБК

Профессия: Python-разработчик + ИИ

8 месяцев

Далее

Решения вопроса 3

Комментировать

Пригласить эксперта

Ваш ответ на вопрос

Войдите, чтобы написать ответ

Похожие вопросы

Python

+1 ещё

Простой
Почему разрывается подключение к бд на сервере?
- 1 подписчик
- 18 июн.
- 213 просмотров
1

ответ
Python

+2 ещё

Средний
Как новичку найти первые заказы на парсинг данных (Python)?
- 1 подписчик
- 17 июн.
- 566 просмотров
2

ответа
Python

+1 ещё

Сложный
Как на Python реализовать алгоритм, чтобы персонаж шёл по определенному маршруту в Genshin Impact?
- 3 подписчика
- 15 июн.
- 499 просмотров
2

ответа
Python

+1 ещё

Средний
Может кто помочь исправить код LTSM нейросети?
- 1 подписчик
- 12 июн.
- 286 просмотров
2

ответа
Python

+1 ещё

Средний
Telethon отказывается соединятся с серверами Telegram, как это обойти?
- 1 подписчик
- 10 июн.
- 513 просмотров
1

ответ
Python

+1 ещё

Простой
Почему копируется атрибут при создании нового экземпляра?
- 1 подписчик
- 08 июн.
- 215 просмотров
2

ответа
Python

+2 ещё

Простой
Как правильно настроить статические и медиафайлы на хостинге?
- 1 подписчик
- 04 июн.
- 126 просмотров
1

ответ
Python

Простой
Как отправить видео в мессенджер MAX с прогрессом загрузки Python (tqdm)?
- 2 подписчика
- 30 мая
- 332 просмотра
1

ответ
Python

Простой
Стоит ли переходить на IDE?
- 1 подписчик
- 25 мая
- 665 просмотров
5

ответов
Python

+2 ещё

Простой
Где хранить сессию SQLAlchemy в FastAPI: в конструкторе сервиса или передавать в каждый метод?
- 2 подписчика
- 23 мая
- 346 просмотров
1

ответ
Показать ещё Загружается…

Answer 1 · 2020-03-28 06:49:37

Можно попробовать перевести дату и время по отдельности к типу str, затем через пробел сделать конкатенацию, после чего полученное выражение подать на вход функции pd.to_datetime, которая вернет полноценный datetime формат искомых значений.

В случае, если изначальные даты у вас в формате datetime сделать так:
pd.to_datetime(df['start_date'].dt.date.astype(str) + ' ' + df['start_time'].dt.time.astype(str))

А если изначальные даты в строковом формате, то опустить "dt.date" и "dt.time" части.

UPDATE

Еще можно сделать так, например:
date = pd.to_datetime('start_date')
time = pd.to_timedelta('start_time')
date + time
Чтобы получить datetime формат следует сделать следующее:
(date + time).to_pydatetime()

Answer 2 · 2020-03-28 11:15:11

Можно так (если колонка 'start_time' имеет нормальный тип datetime, а не просто строку)

df['new_time'] = df['start_date'].combine(df['start_time'], lambda x,y: datetime.datetime.combine(x, y.time()))

Answer 3 · 2020-03-28 20:31:09

Оба решения выше работают, но если обрабатывать таким образом пачку файлу, то производительность pd.read_csv снижается до неприемлемого уровня. В итоге быстрее и проще спрасить обычным способом в список словарей и сконвертить итог в pd.DataFrame, например, так:

SESSION_REPORT=[]
# ЧИТАЕМ ФАЙЛЫ SESSION REPORT В PYTHON-СЛОВАРЬ #
for SESSION_REPORT_FILE in os.listdir(SESSION_REPORT_PATH):
    with open(SESSION_REPORT_PATH+SESSION_REPORT_FILE, "r", newline="",
              encoding="utf-8") as file:
        start_date=datetime.strptime(SESSION_REPORT_FILE[14:len(SESSION_REPORT_FILE)-4], '%Y-%m-%d')
        reader = csv.reader(file, delimiter = ';')
        for line in reader:
            if line[2]=="Длина текста": continue
            start_time=datetime.combine(start_date.date(),
                    datetime.strptime(line[1], '%H:%M:%S').time())
            voice_length=datetime.combine(start_date.date(),
                    datetime.strptime(line[3], '%H:%M:%S').time())-start_date
            SESSION_REPORT.append({"v2m_guid": line[0], "start_date": start_date, 
                "start_time": start_time,
                "voice_length": voice_length,
                "end_time": start_time+voice_length,
                "text_length": int(line[2])})
    # СОЗДАЕМ DATAFRAME PANDAS #
SESSION_REPORT=pd.DataFrame(SESSION_REPORT)

Как в pd.DataFrame комбинировать дату и время из разных столбцов?

Войдите, чтобы написать ответ

Минуточку внимания

Войдите на сайт