@Bukkakeveron

Как отобрать имена с одинаковыми транскрипциями?

Имеется пандас датафрейм с двумя колонками(см. фото): первая - имена людей на английском, вторая - их фонетическая транскрипция (при помощи словаря nysiis). Как можно из него отобрать имена с одинаковыми транскрипциями?

names = pd.concat(pieces,ignore_index = True)
a=names['name'].unique()
b=list(a)
q=[]
for n in b:
    q.append(fuzzy.nysiis(n))
    
df=pd.DataFrame(b)
df1=pd.DataFrame(q)
w=df.join(df1, how='left', lsuffix='_left', rsuffix='_right')


59f0b5930fef2852372072.png
  • Вопрос задан
  • 116 просмотров
Пригласить эксперта
Ответы на вопрос 1
LazyTalent
@LazyTalent
Data Engineer, Freelancer
Попробуй так:
df[df.duplicated(['0_right'], keep=False)]
Ответ написан
Комментировать
Ваш ответ на вопрос

Войдите, чтобы написать ответ

Похожие вопросы