Почему вложенный цикл теряет доступ к открытому файлу со второй итерации основного цикла?

Question

nohchiborz @nohchiborz

Python

Почему вложенный цикл теряет доступ к открытому файлу со второй итерации основного цикла?

Допустим, есть код:

a = open("A.txt")
b = open("B.txt")
finish_all = open("finish.txt","w")

for a_line in a:
    for b_line in b:
        if a_line != b_line:
            finish_all.write(a_line)

когда я его запускаю, то вложенный цикл проходит по элементам в файле лишь один раз. Например, в файле "А" 10 элементов, а в "B" - 5, то в этом случае вложенный цикл по элементам файла "B" пройдет лишь один раз, в то время, как основной цикл продолжит работу. Будто вложенный цикл после первой итерации теряет из виду файл, по которому должен пройтись.
Но! Если повторить строчку открытия файла в теле основного цикла, то вложенный цикл вдруг срабатывает до конца. В чем же дело?
Кстати, на всякий случай, этот код не реализует того, чего я хотел от него, а именно запись в finish.txt элементов из A.txt, предварительно удалив оттуда лишнее по шаблону из файла B.txt. Но я справлюсь с этим после того как пойму, что не так с вложенным циклом)
Спасибо заранее.

Вопрос задан более трёх лет назад
286 просмотров

Комментировать

Подписаться 2 Оценить Комментировать

Помогут разобраться в теме Все курсы

Нетология

Python-разработчик: расширенный курс + нейросети

12 месяцев

Далее
Skillbox

Python-разработчик

10 месяцев

Далее
ProductStar

Профессия: Python-разработчик

8 месяцев

Далее

Решения вопроса 1

3 комментария

nohchiborz @nohchiborz Автор вопроса

Спасибо большое за такой подробный и полезный ответ.
Теперь все работает)

Написано более трёх лет назад
nohchiborz @nohchiborz Автор вопроса

кстати, а если длина файла огромная, то в какую сторону копать?)

Написано более трёх лет назад
Roman K @deliro
nohchiborz: Немного оптимизировав можно прийти вот к такому решению:
with open('A.txt') as a, open('B.txt') as b, open('finish.txt', 'w') as finish: b_set = {l.strip() for l in b} finish.write('\n'.join(i.strip() for i in a if i.strip() not in b_set))

Таким образом, не придётся хранить множество a_set в оперативе, только b_set.

А вот что делать, если b_set не влезет - я пока не могу придумать, чтобы это было лаконично.
Написано более трёх лет назад

Пригласить эксперта

Ответы на вопрос 2

1 комментарий

Комментировать

Ваш ответ на вопрос

Войдите, чтобы написать ответ

Похожие вопросы

Python

Простой
Почему не работает await event.message.delete()?
- 1 подписчик
- 16 дек.
- 194 просмотра
0

ответов
Python

Простой
Почему при установке iJulia у меня возникает ошибка, указывающая на отсутствие Conda?
- 1 подписчик
- 16 дек.
- 55 просмотров
0

ответов
Python

Простой
Почему выходит ошибка?
- 1 подписчик
- 15 дек.
- 173 просмотра
2

ответа
Python

+1 ещё

Средний
Разработка самообучающегося бота. Как лучше настроить экранное зрение?
- 2 подписчика
- 14 дек.
- 182 просмотра
1

ответ
Python

+2 ещё

Простой
Как получить доступ к элементам внутри shadow-root (closed)?
- 1 подписчик
- 09 дек.
- 125 просмотров
1

ответ
Python

+1 ещё

Простой
Как повысить читабельность кода?
- 1 подписчик
- 08 дек.
- 219 просмотров
0

ответов
Python

Простой
Как получить конкретный атрибут приложенный в обьект?
- 1 подписчик
- 28 нояб.
- 229 просмотров
1

ответ
Python

Простой
Как сохранить курсор в строке ввода при перезапуске explorer.exe?
- 1 подписчик
- 28 нояб.
- 151 просмотр
1

ответ
Python

Простой
Ошибка IndexError: string index out of range в написании реализации системы Линденмайера – от чего происходит и как исправить?
- 1 подписчик
- 27 нояб.
- 154 просмотра
1

ответ
Python

+1 ещё

Простой
Как сделать рассылку в viber в фоне?
- 1 подписчик
- 22 нояб.
- 113 просмотров
0

ответов
Показать ещё Загружается…

Специалист по API и автоматизации данных (Google Apps Script / Python)

Агентство ШОЛЬЧЕВ

До 100 000 ₽

Python Developer

Strikt

от 100 000 до 150 000 ₽

Python Software Engineer - ML/LLM

Ennabl • Лимассол

от 650 000 ₽

Answer 1 · 2016-07-12 19:34:17

Потому что это вложенные циклы, а не параллельные.
Если тебе нужно удалить из А все элементы, которые есть в B, при этом, длины файлов недостаточно большие, чтобы занять всю твою оперативку, можно сделать так:

with open('A.txt') as a, open('B.txt') as b, open('finish.txt', 'w') as finish:
    a_items = [l.strip() for l in a]
    b_set = {l.strip() for l in b}
    finish.write('\n'.join(item for item in a_items if item not in b_set))

Если в finish.txt не важно, не будет дубликатов из А или нет (или, например, A.txt содержит только уникальные значения) и порядок не важен тоже:

with open('A.txt') as a, open('B.txt') as b, open('finish.txt', 'w') as finish:
    a_set = {l.strip() for l in a}
    b_set = {l.strip() for l in b}
    finish.write('\n'.join(a_set - b_set))

Answer 2 · 2016-07-12 20:00:59

Итерация по файлу отличается от итерации по списку.
При использовании в цикле списка, готового объекта-итератора нет, и для списка интерпретатор создаёт объект-итератор.
Но файловый объект - сам себе итератор, поэтому интерпретатор использует для итерирования уже существующий итератор, а не создаёт новый. Поэтому, если итератор файлового объекта исчерпается после прохода по нему, то к следующему витку он так и останется исчерпанным.

Answer 3 · 2016-07-13 15:27:52

Используй b.seek(0) после каждого цикла по b. И не забудь закрыть файлы после работы с ними - хороший стиль. Либо используй with изначально.

Почему вложенный цикл теряет доступ к открытому файлу со второй итерации основного цикла?

Войдите, чтобы написать ответ

Минуточку внимания

Войдите на сайт