Выборка из Data Frame в Pandas.Как осуществить?

Question

gadzhi15 @gadzhi15

Выборка из Data Frame в Pandas.Как осуществить?

Существует некий data frame. Столбцы содержат: Имя и Фамилия, Возраст, Пол. Мне нужно выяснить какое имя встречается чаще у женского пола. Создаk новый data frame и занеc в него только те имена, у которых в поле возраст стоит F. Data Frame получился следующим:

Nasser, Mrs. Nicholas (Adele Achem)
Sandstrom, Miss. Marguerite Rut
Bonnell, Miss. Elizabeth
Vestrom, Miss. Hulda Amanda Adolfina

Как я понял, имя стоит после слов Miss или Mrs. Теперь возникает проблема, которую не могу решить. Как в Столбце "Имя и Фамилия" в строках удалить слова и символы стоящие до имени? Пробовал с помощью str.lstrip and str.rstrip, но не получается.

P.S. Задача из курса на Cousera

Вопрос задан более трёх лет назад
15184 просмотра

Комментировать

Подписаться 3 Оценить Комментировать

Помогут разобраться в теме Все курсы

Нетология

Python-разработчик: расширенный курс + нейросети

12 месяцев

Далее
Академия Эдюсон

Python-разработчик + ИИ

9 месяцев

Далее
ProductStar × РБК

Профессия: Python-разработчик + ИИ

8 месяцев

Далее

Решения вопроса 1

5 комментариев

gadzhi15 @gadzhi15 Автор вопроса

Как я понял, нужно посчитать количество символов до точки в каждой строке и дальше удалить?

Написано более трёх лет назад
Олег Дроздов @Ardarick

Использовал такой же вариант решения для данной задачи в этом курсе =)

Написано более трёх лет назад
gadzhi15 @gadzhi15 Автор вопроса

Олег Дроздов: отсек ненужны. Вчера встречал функцию, которая вычисляет какие значения сколько раз встречаются в Data Frame. Забыл сохранить. Сейчас найти никак не могу.

Написано более трёх лет назад
Владимир Олохтонов @sgjurano

gadzhi15: a.split('.') - разделяем всю строку по символу точка, [1] - берем второй элемент (индекс 1 соответствует второму элементу в списке), .replace('(', '') - заменяем левую круглую скобку на пустой элемент, аналогично с правой скобкой. После этого .split() разбивает строку по пробелам, на выходе даёт список строк. Попробуйте поэксперементировать с этими командами, увидите результаты их работы и сразу всё поймете :)

Написано более трёх лет назад
Vlad_Fedorenko @Vlad_Fedorenko

gadzhi15: вы про value_counts?

Написано более трёх лет назад

Пригласить эксперта

Ответы на вопрос 1

Комментировать

Ваш ответ на вопрос

Войдите, чтобы написать ответ

Похожие вопросы

Python

+1 ещё

Сложный
Как обойти uefi при создании собственной операционной системы?
- 1 подписчик
- 7 часов назад
- 126 просмотров
2

ответа
Python

Средний
Как правильно определять изменяющиеся типы полей при наследовании классов в python?
- 1 подписчик
- 13 часов назад
- 48 просмотров
1

ответ
Python

+2 ещё

Простой
Можно ли полностью отказаться от vkhost в пользу VK ID для серверного приложения?
- 3 подписчика
- 14 июл.
- 208 просмотров
0

ответов
Карьера в IT

+1 ещё

Средний
Хочу попробовать стать системным аналитиком, с чего лучше начать и во сколько попытаться найти работу?
- 5 подписчиков
- 25 июн.
- 1009 просмотров
6

ответов
Python

+1 ещё

Простой
Почему разрывается подключение к бд на сервере?
- 1 подписчик
- 18 июн.
- 224 просмотра
1

ответ
Python

+2 ещё

Средний
Как новичку найти первые заказы на парсинг данных (Python)?
- 1 подписчик
- 17 июн.
- 621 просмотр
2

ответа
Python

+1 ещё

Сложный
Как на Python реализовать алгоритм, чтобы персонаж шёл по определенному маршруту в Genshin Impact?
- 3 подписчика
- 15 июн.
- 539 просмотров
2

ответа
Python

+1 ещё

Средний
Может кто помочь исправить код LTSM нейросети?
- 1 подписчик
- 12 июн.
- 300 просмотров
2

ответа
Python

+1 ещё

Средний
Telethon отказывается соединятся с серверами Telegram, как это обойти?
- 1 подписчик
- 10 июн.
- 553 просмотра
1

ответ
Python

+1 ещё

Простой
Почему копируется атрибут при создании нового экземпляра?
- 1 подписчик
- 08 июн.
- 223 просмотра
2

ответа
Показать ещё Загружается…

Answer 1 · 2016-02-09 09:05:48

Не совсем так. Имя - первое слово после "Miss", "Mrs", если в строке нет круглых скобок.
В целом самый простой вариант для этого задания - выкинуть все до точки, и посмотреть каких слов больше, не разбираясь имя или нет.
Достаточно предположить, что самое распространённое имя встречается чаще самой распространённой фамилии :)

Что-то вроде:

female_names = ['Nasser, Mrs. Nicholas (Adele Achem)', 'Sandstrom, Miss. Marguerite Rut', 'Bonnell, Miss. Elizabeth']
names = {}
for name in female_names:
    for word in a.split('.')[1].replace('(', '').replace(')', '').split():
        names.setdefault(word)
        names[word] += 1

Answer 2 · 2016-03-16 18:27:57

Говнокод, но работает.

import pandas

data = pandas.read_csv('titanic.csv', index_col='PassengerId')
data2 = data[data.Sex == 'female']['Name']


C = []
for i in data2:
	if '(' in i:
		if ')' in i.split('(')[1].split(' ')[0]:
			C.append(i.split('(')[1].split(' ')[0].split(')')[0])
		else:
			C.append(i.split('(')[1].split(' ')[0])

	else:
		C.append(i.split('. ')[1].split(' ')[0])

print pandas.DataFrame.from_dict(C)[0].value_counts()

Выборка из Data Frame в Pandas.Как осуществить?

Войдите, чтобы написать ответ

Минуточку внимания

Войдите на сайт