Задать вопрос
  • Как вычислить количество записей?

    Vindicar
    @Vindicar
    RTFM!
    Прочитать все записи, разбить строку по разделителю, скормить всё в collections.Counter.
    С pandas не работал, вот пример для списков:
    from collections import Counter
    from itertools import chain
    data = [
      (1, 'old;white'),
      (2, 'old;green'),
      (3, 'old;brown'),
      (4, 'new;green'),
    ]
    # генерирует последовательность ['old', 'white'], ['old', 'green'], ...
    split_generator = (item[1].split(';') for item in data) 
    # генерирует последовательность 'old', 'white', 'old', 'green', ...
    property_generator = chain.from_iterable(split_generator)
    # исправляет регистр и удаляет пробелы - можно убрать, если не надо
    property_fixed_generator = (item.strip().lower() for item in property_generator)
    # поглощает данные из генераторов и считает вхождения
    count = Counter(property_fixed_generator)
    print(count)  # Counter({'old': 3, 'green': 2, 'white': 1, 'brown': 1, 'new': 1})
    Ответ написан
    Комментировать
  • Как применить функцию для всего датафрейма pandas?

    @angrypotato666
    Была похожая ситуация.

    df = df.astype(str)
    
    def cleaner(column):
        return texthero.clean(column)


    Если нужно будет вывести графики:

    for column in df.columns:
    fig = go.Figure(data=[go.Histogram(x=df[column])])
    fig.update_layout(title=f'Гистограмма для столбца: {column}', xaxis_title=column)
    fig.show()
    Ответ написан
    Комментировать