Как в pandas сделать список на основании данных нескольких столбцов?

Question

san_m_m @san_m_m

Python

Как в pandas сделать список на основании данных нескольких столбцов?

Добрый день!

Есть DataFrame

import pandas as pd
df = pd.DataFrame({'movie': [9999999,  2,  3, 1, 9999999],
                  'rating': [3,  2,  9999999, 9999999, 3],
                  'name': [1,  2,  4, 5, 10]})

Нужно добавить еще один столбец, в котором будут данные по следующей логике...
Если в столбце movie 9999999, то берется значение из столбца rating, если в rating 9999999, то name
попробовал написать следующий код, но как мне кажется идея в корне не верна, поэтому я тут...

kol = []
for l in df:
    for i in l:
        if i['movie'] != 9999999:
            k = i['movie']
        elif i['rating'] != 9999999:
            k = i['rating']
        else:
            k = i['name']
        kol.append(k)
df['sum'] = kol

Вопрос задан более двух лет назад
82 просмотра

1 комментарий

Подписаться 2 Простой 1 комментарий

Решения вопроса 2

Комментировать

Пригласить эксперта

Ваш ответ на вопрос

Войдите, чтобы написать ответ

Войти через центр авторизации

Похожие вопросы

Python

+2 ещё

Простой
Как получить список приглосительных ссылок в телеграм канале?
- 1 подписчик
- 6 часов назад
- 26 просмотров
0

ответов
Python

+4 ещё

Простой
Aiogram, ERROR Yellow code, aiogram.types.web_app_info not imported?
- 1 подписчик
- 8 часов назад
- 54 просмотра
1

ответ
Python

+1 ещё

Простой
Бот не реагирует на заданные команды?
- 1 подписчик
- 9 часов назад
- 39 просмотров
0

ответов
Python

Простой
Сохраняется ли куда-то скриншот в Pyautogui?
- 1 подписчик
- 10 часов назад
- 31 просмотр
1

ответ
Python

Простой
Пишу Todolist появилась ошибка, как исправить?
- 1 подписчик
- 20 часов назад
- 50 просмотров
1

ответ
Python

+1 ещё

Простой
Как решить проблему с терминалом PyCharm?
- 1 подписчик
- 20 часов назад
- 50 просмотров
1

ответ
Python

+2 ещё

Средний
Как пофиксить ошибку с сертификатом при работе с selenium?
- 1 подписчик
- 22 часа назад
- 23 просмотра
0

ответов
Python

+2 ещё

Средний
Возможно ли сделать так, чтобы Telegram GPT-Yandex.Cloud Бот отвечал не только на текстовые сообщения, но и на картинки? И если да, то как?
- 1 подписчик
- 22 часа назад
- 56 просмотров
2

ответа
Python

Средний
Как выполнить авторизацию MS CHAP 2?
- 1 подписчик
- вчера
- 33 просмотра
0

ответов
Python

+1 ещё

Простой
Как вычислить количество записей?
- 1 подписчик
- вчера
- 70 просмотров
2

ответа
Показать ещё Загружается…

Team Lead (С++, Python)

TopAssistant • Москва

от 400 000 ₽

Python developer

Bell Integrator

До 350 000 ₽

Python developer

Greenway Global • Новосибирск

от 150 000 ₽

Развернуть web app написанный и готовый, из архива готовый код

20 апр. 2024, в 19:11

4000 руб./за проект

Настроить доступ к Netflix

20 апр. 2024, в 18:04

3000 руб./за проект

Помочь настроить GeoIp у nginx для docker nginx:alpine

20 апр. 2024, в 17:55

3000 руб./за проект

Вам что, для задания выдали мало букв? Как насчёт поименовать переменные внятно, чтоб было понятно в чем суть всех этих l, i…

Answer 1 · 2021-07-29 13:09:37

Можно вынести вычисления в функцию и применить apply.

import pandas as pd
df = pd.DataFrame({'movie': [9999999,  2,  3, 1, 9999999],
                  'rating': [3,  2,  9999999, 9999999, 3],
                  'name': [1,  2,  4, 5, 10]})

def process(row):
    result = row['movie']
    if row['movie'] == 9999999:
        if row['rating'] == 9999999:
            result = row['name']
        else:
            result = row['rating']
    return result

df['sum'] = df.apply(process, axis=1)

Answer 2 · 2021-07-30 11:14:39

Не надо в пандасе использовать циклы - это медленно и некрасиво, т.к. пандас - векторный по своей сути. Потому что основан на нампае. Так что используй подходящий инструмент из нампая. Для фильтрации по значениям столбцов - это функция numpy.where, которую можно вкладывать в себя, как обычные условные операторы:

import numpy as np
import pandas as pd

if __name__ == '__main__':

    df = pd.DataFrame({
        'movie': [9999999,  2,  3, 1, 9999999],
        'rating': [9999999,  2,  9999999, 9999999, 3],
        'name': [1,  2,  4, 5, 10]})

    df['result'] = np.where(
        df['movie'] != 9999999,
        df['movie'],
        np.where(
            df['rating'] != 9999999,
            df['rating'],
            df['name']))

    print(df)

Результат:

movie   rating  name  result
0  9999999  9999999     1       1
1        2        2     2       2
2        3  9999999     4       3
3        1  9999999     5       1
4  9999999        3    10       3

Как в pandas сделать список на основании данных нескольких столбцов?

Войдите, чтобы написать ответ

Минуточку внимания

Войдите на сайт