Как скорректировать запрос для поиска подстроки?

Всем привет. Есть файл .xls в нем столбцы А, Б, В . В столбце В содержится любая информация от даты до текста, с запятыми и прочими, и в таком столбце надо найти строку. Сам excel с этим успешно справляется, а вот на питоне получается лажа. Что делаю не так?
Вот код:

ff = padas.read_excel('12.xls')

searchstr=ff.loc[ff['B'].str.containts('строка' )==True)][['А','B']]
searchstr.to_excel('12334556', index=false)


Спасибо
  • Вопрос задан
  • 26 просмотров
Пригласить эксперта
Ответы на вопрос 1
Maksim_64
@Maksim_64
Data Analyst
Во первых ==True здесь совершенно лишнее, contains вернет массив длинной ff['B'], где True, будет означать берем данную строку, ок он не выдаст ошибку, но он тут абсолютно лишний и ничего не делает.

Во вторых, обычно str.contains обычно используют вместе с регуляркой. Предоставляют выражения также используют flags для установки различных параметров, например осуществить поиск не чувствительным к регистру, для примера.
import re
searchstr=(
    ff.loc[ff['B']
    .str.contains(r'строка',regex=True,flags=re.IGNORECASE),['А','B']
    ]
)
Выберет подсет датафрейма ff (колонки 'A' и 'B'), где в 'В' содержится 'строка'.
Ответ написан
Комментировать
Ваш ответ на вопрос

Войдите, чтобы написать ответ

Войти через центр авторизации
Похожие вопросы