@w2002w

Как создать +- универсальную функцию для очистки dataframe?

Добрый день, хочу написать функцию, которая бы показывала классическую инфу о пропусках в данных. Чтобы она выводила только те пропуски, которые присутствуют, в виде
"'NaN': 12
'-1.#IND': 269"
def cleaner(df,column):
    '''It shows info about basic missing values'''
    nans = df[column].isna().sum()
    nothing = (df[column]=='').sum()
    coded_spaces = (df[column]=='\xa0').sum()
    spaces = (df[column]==' ').sum()
    x1 = (df[column]=='#N/A').sum()
    x2 = (df[column]=='#N/A N/A').sum()
    x3 = (df[column]=='#NA').sum()
    x4 = (df[column]=='-1.#IND').sum()
    x5 = (df[column]=='-1.#QNAN').sum()
    x6 = (df[column]=='-NaN').sum()
    x7 = (df[column]=='-nan').sum()
    x8 = (df[column]=='1.#IND').sum()
    x9 = (df[column]=='1.#QNAN').sum()
    x10 = (df[column]=='N/A').sum()
    x11 = (df[column]=='NA').sum()
    x12 = (df[column]=='NULL').sum()
    x13 = (df[column]=='NaN').sum()
    x14 = (df[column]=='n/a').sum()
    x15 = (df[column]=='nan').sum()
    x16 = (df[column]=='null').sum()
    
    for  val in [nans,coded_spaces,spaces,x1,x2,x3,x4,x5,x6,x7,x8,x9,x10,x11,x12,x13,x14,x15,x16]:
          if val > 0:
          return print(f'')

Но функция выходит очень громостская, подскаэите пожалуйста, как это улучшить? Спасибо !
  • Вопрос задан
  • 50 просмотров
Решения вопроса 1
phaggi
@phaggi Куратор тега Python
лужу, паяю, ЭВМы починяю
Сложить все варианты в множество и проверять через пересечение множества и колонки в df?
Ответ написан
Пригласить эксперта
Ваш ответ на вопрос

Войдите, чтобы написать ответ

Войти через центр авторизации
Похожие вопросы