Как найти количество одинаковых слов в одном и другом списке?

Question

AlessandrIT @AlessandrIT

Python

Как найти количество одинаковых слов в одном и другом списке?

Имеется 2 списка.Один - слова, количество упоминаний которых требуется получить.
Второй - список из слов, получается путём

f = open('text.txt', 'r')
b = []
for line in f:
   a = line.split()
   for x in a:
      b.append(a)
f.close()

В файле текст помимо слов содержит знаки препинания, цифры, прочий мусор.

Вопрос - как можно получить количество вхождений слов из списка в строку?

P.S. Таких списков несколько, код желательно с возможностью оптимизации.

Вопрос задан более трёх лет назад
242 просмотра

1 комментарий

Подписаться 1 Простой 1 комментарий

Помогут разобраться в теме Все курсы

Нетология

Python-разработчик: расширенный курс + нейросети

12 месяцев

Далее
Академия Эдюсон

Python-разработчик + ИИ

9 месяцев

Далее
ProductStar × РБК

Профессия: Python-разработчик + ИИ

8 месяцев

Далее

Решения вопроса 1

2 комментария

AlessandrIT @AlessandrIT Автор вопроса

Опишу подробнее.Есть исходный текст, разбивается на строки циклом и на слова командой split + очистка от спецсимволов и цифр..Получаю список всех слов текста.Затем этот список я проверяю на нахождение в оном слов из другого, заранее известного списка.Поскольку такую процедуру с одним и тем же файлом надо провернуть 4 раза - я ищу оптимальный метод.

Написано более трёх лет назад
LJ322 @LJ322
Если список со словами из файла один, а списков со словами, которые необходимо проверить - четыре. То в данном случае первый вариант подходит. Заглавными буквами я отметил заранее известные списки со словами (помимо A и B можете объявить ещё C и D, так как все 4 списка известны). И параллельный обход 4 списков записать в виде
for (i, j, k, l) in zip(A, B, C, D): # где i, j, k , l - слова из известных списков for line in b:

Таким образом вы одновременно проверите файл сразу на 4 известных списка
Вывод данных уже запишите так, как вам будет удобнее читать.
Написано более трёх лет назад

Пригласить эксперта

Ответы на вопрос 1

Комментировать

Ваш ответ на вопрос

Войдите, чтобы написать ответ

Похожие вопросы

Python

+1 ещё

Простой
Почему разрывается подключение к бд на сервере?
- 1 подписчик
- 18 июн.
- 214 просмотров
1

ответ
Python

+2 ещё

Средний
Как новичку найти первые заказы на парсинг данных (Python)?
- 1 подписчик
- 17 июн.
- 568 просмотров
2

ответа
Python

+1 ещё

Сложный
Как на Python реализовать алгоритм, чтобы персонаж шёл по определенному маршруту в Genshin Impact?
- 3 подписчика
- 15 июн.
- 500 просмотров
2

ответа
Python

+1 ещё

Средний
Может кто помочь исправить код LTSM нейросети?
- 1 подписчик
- 12 июн.
- 286 просмотров
2

ответа
Python

+1 ещё

Средний
Telethon отказывается соединятся с серверами Telegram, как это обойти?
- 1 подписчик
- 10 июн.
- 514 просмотров
1

ответ
Python

+1 ещё

Простой
Почему копируется атрибут при создании нового экземпляра?
- 1 подписчик
- 08 июн.
- 215 просмотров
2

ответа
Python

+2 ещё

Простой
Как правильно настроить статические и медиафайлы на хостинге?
- 1 подписчик
- 04 июн.
- 126 просмотров
1

ответ
Python

Простой
Как отправить видео в мессенджер MAX с прогрессом загрузки Python (tqdm)?
- 2 подписчика
- 30 мая
- 332 просмотра
1

ответ
Python

Простой
Стоит ли переходить на IDE?
- 1 подписчик
- 25 мая
- 666 просмотров
5

ответов
Python

+2 ещё

Простой
Где хранить сессию SQLAlchemy в FastAPI: в конструкторе сервиса или передавать в каждый метод?
- 2 подписчика
- 23 мая
- 347 просмотров
1

ответ
Показать ещё Загружается…

Сделать домашку/лабу/тестовое/т.д. задание за тебя?
Свой код в студию, тогда можно будет поговорить.

Answer 1 · 2019-05-02 23:55:16

Если я правильно понял, то имеется несколько списков со словами, упоминание которых необходимо подсчитать в строках файла (в списке строк)

spoiler

f = open('text.txt', 'r')
b = []
A = []                                  # Список слов, упоминание которых нужно посчитать в файле
B = []                                  # Список слов №2
for line in f:
    a = line.split()
    c = []                              # Список для нормальных слов
    for x in a:
        for char in x:                  # Проверяет символы char в слове x 
            if not char.isalpha():      # Если char не является буквой
                x = x.replace(char, '') # Убирает char, не являющийся буквой
        c.append(x.lower())             # Добавляет нормальное слово (без всяких !"-, символов) в список (с нижним регистром)
    b.append(c)                         # Добавляет строку из нормальных слов в список
f.close()


for (i, j) in zip(A, B):                # Параллельный обход всех списков со словами, количество которых надо посчитать (для примера A и B)
    for line in b:
        print('Строка ', b.index(line), ': ', i, '=>', line.count(i), ' ', j, '=>', line.count(j))

P.S. Перечитал вопрос, видимо речь шла о нескольких файлах и об одном списке со словами, которые необходимо посчитать. Тогда достаточно добавить ещё один список строк, как вы это сделали изначально:

spoiler

g = open('text2.txt', 'r')
'...'

for i in A:                        
    for (line1, line2) in zip(b, g):    # Параллельный обход нескольких списков со строками
        print('Строка в списке b ', b.index(line1), ': ', i, '=>', line1.count(i), ' ', 'Строка в списке g ', g.index(line2), ': ', i, '=>', line2.count(i))

Answer 2 · 2019-05-02 19:15:31

Dimonchik @dimonchik2013

non progredi est regredi

https://pymotw.com/2/collections/counter.html

Ответ написан более трёх лет назад

Комментировать

Как найти количество одинаковых слов в одном и другом списке?

Войдите, чтобы написать ответ

Минуточку внимания

Войдите на сайт