Как применить функцию построчно pandas?

Question

Кай @Tr3ShKirill

Наблюдатель Вселенной

Python

Как применить функцию построчно pandas?

Привет! Подскажите, плиз, что-то совсем запутался.

Примитивный фрейм данных.

Пытаюсь записать в новый стоблец схожесть текста в столбцах a и b

def similarity(s1, s2):
    matcher = difflib.SequenceMatcher(None, s1, s2)
    return matcher.ratio()

Пробовал так,
zz['sim1'] = similarity(zz['a'], zz['b'])

И так

zz['sim2'] = zz.apply(lambda row: similarity(zz['a'], zz['b']), axis=1)

Получается не то, что нужно. Как будто сравнивается весь стоблец сразу.

Нужно сравнить построчно и записать значение для каждой строки в новый столбец.
Буду благодарен любой помощи, наводки.

Вопрос задан более трёх лет назад
237 просмотров

Комментировать

Подписаться 1 Простой Комментировать

Помогут разобраться в теме Все курсы

Нетология

Python-разработчик: расширенный курс + нейросети

12 месяцев

Далее
Академия Эдюсон

Python-разработчик + ИИ

9 месяцев

Далее
ProductStar × РБК

Профессия: Python-разработчик + ИИ

8 месяцев

Далее

Решения вопроса 1

1 комментарий

Кай @Tr3ShKirill Автор вопроса
Спасибо!
заменил на row и всё получилось

zz['sim2'] = zz.apply(lambda row: similarity(row['a'], row['b']), axis=1)
Написано более трёх лет назад

Пригласить эксперта

Ваш ответ на вопрос

Войдите, чтобы написать ответ

Похожие вопросы

Python

+1 ещё

Средний
Почему не работает пример quickstart из документации GLiNKER?
- 1 подписчик
- вчера
- 62 просмотра
1

ответ
Python

Средний
Как правильно определять изменяющиеся типы полей при наследовании классов в python?
- 1 подписчик
- 17 июл.
- 83 просмотра
1

ответ
Python

+2 ещё

Простой
Можно ли полностью отказаться от vkhost в пользу VK ID для серверного приложения?
- 3 подписчика
- 14 июл.
- 279 просмотров
0

ответов
Python

+1 ещё

Простой
Почему разрывается подключение к бд на сервере?
- 1 подписчик
- 18 июн.
- 233 просмотра
1

ответ
Python

+2 ещё

Средний
Как новичку найти первые заказы на парсинг данных (Python)?
- 1 подписчик
- 17 июн.
- 645 просмотров
2

ответа
Python

+1 ещё

Сложный
Как на Python реализовать алгоритм, чтобы персонаж шёл по определенному маршруту в Genshin Impact?
- 3 подписчика
- 15 июн.
- 549 просмотров
2

ответа
Python

+1 ещё

Средний
Может кто помочь исправить код LTSM нейросети?
- 1 подписчик
- 12 июн.
- 307 просмотров
2

ответа
Python

+1 ещё

Средний
Telethon отказывается соединятся с серверами Telegram, как это обойти?
- 1 подписчик
- 10 июн.
- 562 просмотра
1

ответ
Python

+1 ещё

Простой
Почему копируется атрибут при создании нового экземпляра?
- 1 подписчик
- 08 июн.
- 226 просмотров
2

ответа
Python

+2 ещё

Простой
Как правильно настроить статические и медиафайлы на хостинге?
- 1 подписчик
- 04 июн.
- 140 просмотров
1

ответ
Показать ещё Загружается…

Answer 1 · 2022-03-16 01:37:10

Первый вариант неправильный, столбцу таким образом назначается одинаковое значение для всех ячеек.

Во втором варианте если то что перебирает лямбда называется row, то и ячейки должны быть у row. А zz['a'], zz['b'] это не ячейки в строке, а столбцы

Как применить функцию построчно pandas?

Войдите, чтобы написать ответ

Минуточку внимания

Войдите на сайт