Задать вопрос
@RockyMotion

Как правильно посчитать количество символов в каждом слове в dataframe?

Есть Dataframe, в котором содержатся строки, уже токеннизированные и лемматизированные.
Типо такой:
['postgres', 'почему', 'pg_dumpall', 'быстрый', 'pg_dump']


Я хочу посчитать количество символов в каждой строке и получить на выход такое:
8,5,9,6,4,7

Как мне правильно это сделать?
Я пытался перебрать все зачения через for i, но так либо только строки могу получить, либо символы, не могу подать отдельно все слова из строки по очереди, как это сделать?
  • Вопрос задан
  • 5867 просмотров
Подписаться 1 Простой 3 комментария
Пригласить эксперта
Ответы на вопрос 3
@penton7
Не совсем понял вопрос, если вам нужно просто посчитать количество символов в каждом слове, то это через for.
Ответ написан
@NeeL
Если я правильно понял вопрос, то так:

data = ['postgres', 'почему', 'pg_dumpall', 'быстрый', 'pg_dump']
z =[]
for i in data:
  z.append (len(i))
print(z)
Ответ написан
Комментировать
@willage
df.apply(len)
или
df.str.len()
===ПРИМЕР===
import pandas as pd

df = pd.Series(['the', 'weather', 'is', 'fine'])

print(df.apply(len))
===РЕЗУЛЬТАТ===
0 3
1 7
2 2
3 4
dtype: int64
Ответ написан
Комментировать
Ваш ответ на вопрос

Войдите, чтобы написать ответ

Похожие вопросы