Как условно (значение в столбце) искать подстроки в другом столбце в цикле python?

Question

valerchik433 @valerchik433

Как условно (значение в столбце) искать подстроки в другом столбце в цикле python?

Мне нужно выполнить поиск подстроки в строке по условию во втором столбце. У меня есть 2 фрейма данных:

df1 = {'Descr': ["VALVE, PRESSURE", "pump ttf", "Valve, electrical", "Geeku, electrical","VALVE, OVERBOARD, BUTTERFLY"],
        'N_Product': ["VALVE", "PUMP", "VALVE", "GEEKU","VALVE"],
        }
df2 = {'N_Product': ["VALVE", "VALVE","VALVE", "PUMP", "GEEKU"],
        'M_Product': ["PRESSURE", "qwerty","", "", "ELECTRICAL"],
        }
df1 = pd.DataFrame(df1)
df2 = pd.DataFrame(df2)

(шаг 1) Для первой строки в df1 столбец N_Product имеет значение VALVE.
(шаг 2) Ищем VALVE в столбце N_Product каждой строки df2 и находим 3 совпадения с следующими парами (N_Product, M_Product): строка 0 содержит VALVE,PRESSURE; строка 1 имеет VALVE, qwerty; строка2 имеет VALVE,"".
(шаг 3) Затем вам нужно проверить, содержится ли любая из этих пар (df2(M_Product)) в Df1 ['Descr'], если она содержится, то вам нужно написать N_Product+":"+M_Product+";" . Для Valve нужно искать только "PRESSURE", "Electrical" и "", другие не нужны, для N_Product ('GEEKU') - только "Electrical"' и т.д., в зависимости от того, какие пары есть в файле df2

c = df2['M_Product'].astype(str).to_list()
def matcher(x):
    for i in c:
        if i.lower() in x.lower():
            return i
    else:
        return np.nan
df1['Res'] = df1['Descr'].apply(matcher)

но я не знаю, как перебирать значение только соответствующего M_Product для N_Product.

Желаемый результат:

df1 = {'Descr': ["VALVE, PRESSURE", "pump ttf", "Valve, electrical", "Geeku, electrical","VALVE, OVERBOARD, BUTTERFLY"],
        'N_Product': ["VALVE", "PUMP", "VALVE", "GEEKU","VALVE"],
        },
'Result': ["VALVE: PRESSURE;", "PUMP", "VALVE;", "GEEKU: ELECTRICAL;","VALVE;"],
        }

Буду признателен за любую помощь. Если есть варианты, помогите

Вопрос задан более трёх лет назад
111 просмотров

2 комментария

Подписаться 1 Средний 2 комментария

Помогут разобраться в теме Все курсы

Нетология

Python-разработчик: расширенный курс + нейросети

12 месяцев

Далее
Яндекс Практикум

Python-разработчик

10 месяцев

Далее
Skillbox

Профессия Python-разработчик + ИИ

10 месяцев

Далее

Решения вопроса 1

Комментировать

Пригласить эксперта

Ваш ответ на вопрос

Войдите, чтобы написать ответ

Похожие вопросы

Python

+1 ещё

Простой
Как при вызове хранимой процедуры получать значения RAISE NOTICE?
- 2 подписчика
- 13 апр.
- 199 просмотров
2

ответа
Python

+2 ещё

Простой
Почему не работает Selenium?
- 1 подписчик
- 09 апр.
- 212 просмотров
2

ответа
Python

Простой
В чем ошибка в использовании ft.ResponsiveView в данном коде?
- 1 подписчик
- 08 апр.
- 73 просмотра
1

ответ
Python

Простой
Можно ли указывать во flet heigh и width через проценты?
- 1 подписчик
- 02 апр.
- 104 просмотра
1

ответ
Python

Простой
Как правильно позиционировать элементы во flet?
- 1 подписчик
- 02 апр.
- 96 просмотров
1

ответ
Базы данных

Простой
Как решить проблему когда две запущенные транзакции изменяют одну и ту же строку, но одна из транзакций видит старые данные а не новые?
- 1 подписчик
- 28 мар.
- 233 просмотра
3

ответа
Python

Простой
Почему может не отображаться страница во view(flet)?
- 1 подписчик
- 25 мар.
- 117 просмотров
1

ответ
Python

Средний
Asyncio + PySide6 + Telethon: список чатов и треды грузятся 30 минут — где искать причину?
- 2 подписчика
- 16 мар.
- 463 просмотра
2

ответа
Базы данных

Простой
Когда использовать рекурсивное удаление?
- 1 подписчик
- 10 мар.
- 144 просмотра
2

ответа
Python

+2 ещё

Средний
Можно ли получить доступ к сайту?
- 3 подписчика
- 05 мар.
- 986 просмотров
4

ответа
Показать ещё Загружается…

Python Developer

ITK academy • Краснодар

от 75 000 ₽

Python разработчик

DimaTech Ltd • Краснодар

от 140 000 до 140 000 ₽

Junior AI Automation Engineer / AI-инженер (junior)

OPENCITY • Москва

от 50 000 ₽

Валера, на этом сайте принято на русском языке вопросы задавать.

Answer 1 · 2022-05-20 02:58:04

Я тут накропал

велосипедик на костылях

import pandas as pd


def get_pairs(keys: list, data: list) -> dict:
    """
    Подготовительная функция
    Раскладывает значения из data по ключам из key в порядке, как в key
    :param keys: ['foo', 'spam', 'foo', ...]
    :param data: [('foo', 'bar'), ('foo', 'baz'), ('spam', 'ham'), ...]
    :return: {'foo': ['bar', 'baz'], 'spam': ['ham'], ...}
    """
    inter_pairs = dict([(key, []) for key in set(keys)])
    while bool(len(data)):
        key, value = data.pop(0)
        inter_pairs[key].append(value)
    return inter_pairs


def prepare_next_attr(key: str, value: str, descr: list) -> tuple:
    """
    Служебная функция
    Готовит очередной комплект атрибутов
    для вычисления следующего результата
    :param key:
    :param value:
    :param descr:
    :return: next_key, next_pair, next_descr
    """
    descr = [i.lower() for i in descr]
    next_key = f'{key.lower()}, '
    next_pair = f'{next_key}{value.lower()}'
    next_descr = descr.pop(0)
    return next_key, next_pair, next_descr


def get_next_res_item(key: str, value: str, descr: list) -> str:
    """
    Служебная функция
    Готовит результат, сравнивая по Descr
    (тут подгонка if-ами под задание)
    :param key:
    :param value:
    :param descr:
    :return: результат для помещения в список результатов
    """
    next_key, next_pair, next_descr = prepare_next_attr(key, value, descr)
    if next_pair == next_descr:
        res_item = f'{key}: {value};'
    elif next_key in next_descr:
        res_item = f'{key};'
    else:
        res_item = f'{key}'
    return res_item


def make_result(keys: list, inter_pairs: dict, descr: list) -> pd.Series:
    """
    Перебирает ключи, получает для каждого очередной результат,
    складывает результаты в pd.Series
    :param keys:
    :param inter_pairs:
    :param descr:
    :return: pd.Series с результатами
    """
    intermedia_result = []
    for key in keys:
        value = inter_pairs[key].pop(0)
        intermedia_result.append(
            get_next_res_item(key,
                              value,
                              descr)
        )
    return pd.Series(intermedia_result)


if __name__ == '__main__':
    df1 = {
        'Descr': ["VALVE, PRESSURE", "pump ttf", "Valve, electrical", "Geeku, electrical",
                  "VALVE, OVERBOARD, BUTTERFLY"],
        'N_Product': ["VALVE", "PUMP", "VALVE", "GEEKU", "VALVE"],
    }
    df2 = {'N_Product': ["VALVE", "VALVE", "VALVE", "PUMP", "GEEKU"],
           'M_Product': ["PRESSURE", "qwerty", "", "", "ELECTRICAL"],
           }
    target = {
        'Descr': ["VALVE, PRESSURE", "pump ttf", "Valve, electrical", "Geeku, electrical", "VALVE, OVERBOARD, "
                                                                                           "BUTTERFLY"],
        'N_Product': ["VALVE", "PUMP", "VALVE", "GEEKU", "VALVE"],
        'Result': ["VALVE: PRESSURE;", "PUMP", "VALVE;", "GEEKU: ELECTRICAL;", "VALVE;"], }
    df1 = pd.DataFrame(df1)
    df2 = pd.DataFrame(df2)
    df_target = pd.DataFrame(target)

    df2_list = list(zip(df2['N_Product'], df2['M_Product']))
    pairs = get_pairs(df1['N_Product'], df2_list)
    result = make_result(df1['N_Product'], pairs, df1['Descr'])
    df1['Result'] = result.values

    print(df1)
    print(all(df1 == df_target))

Он вроде формально решает задачу... но опять же формально это не ответ на вопрос, а подгонка под целевое задание, причем совсем не pandas-way. Ну, чем могу...

Как условно (значение в столбце) искать подстроки в другом столбце в цикле python?

Войдите, чтобы написать ответ

Минуточку внимания

Войдите на сайт