Чем отличается re от replace в Python 3?

Question

kirussian @kirussian

Python

Чем отличается re от replace в Python 3?

Итак, я применяю в коде регулярное выражение и должно сохраниться 12 картинок. При каждом запуске сохраняется сколько угодно, но только не 12. Почему?
Если я делаю через метод replace, то все корректно работает.
Вот ссылка на код
https://gist.github.com/kirussian911/8a14ab685b10e...

spoiler

import urllib.request
import re

page_number = 1
def load_source(website):
    site = urllib.request.urlopen(website)
    read_site = site.read()
    return read_site


def parse_img(source):
    links = []
    t = str(source)
    pattern = '<img width="\d+" height="\d+" src="'
    result = re.split(pattern, t)
    # рабочий вариант через replace
    # t = str(source).replace('550', ' ').replace('375', ' ').split('<img width=" " height=" " src="')

    for i in result:
        r = str(i).split('""')
        links.append(r[0])
    return links

def download(links):
    name = 1
    for i in links:
        try:
            v = urllib.request.urlopen(i)
            f = open('Стр' + str(page_number) + 'номер' +  str(name) +  '.jpg', 'wb')
            f.write(v.read())
            f.close()
            name += 1
        except:
            pass

def main():
    print('start page: ')
    print()
    source = load_source('https://aliholic.com/shop/')
    links = parse_img(source)
    download(links)
    print('Tnx')


if __name__=='__main__':
    main()

Вопрос задан более трёх лет назад
141 просмотр

2 комментария

Подписаться 1 Простой 2 комментария

Помогут разобраться в теме Все курсы

Яндекс Практикум

Python-разработчик

10 месяцев

Далее
Skillbox

Python-разработчик

10 месяцев

Далее
Нетология

Fullstack-разработчик на Python + нейросети

20 месяцев

Далее

Пригласить эксперта

Ответы на вопрос 2

Комментировать

Ваш ответ на вопрос

Войдите, чтобы написать ответ

Похожие вопросы

Python

+1 ещё

Простой
Как сделать рассылку в viber в фоне?
- 1 подписчик
- вчера
- 60 просмотров
0

ответов
Python

Простой
Каким образом я могу запускать привязанных ботов в основном, что-бы основной loop не ломался и не дублировался?
- 1 подписчик
- 15 нояб.
- 211 просмотров
1

ответ
Python

Простой
Почему конвертация .py файла в .exe с помощью auto-py-to-exe происходит аномально долго и как это исправить?
- 1 подписчик
- 08 нояб.
- 247 просмотров
0

ответов
Python

+2 ещё

Простой
Как решить ошибку с отправкой почты через Outlook SMTP?
- 1 подписчик
- 08 нояб.
- 159 просмотров
0

ответов
Python

+2 ещё

Средний
Как конвертировать drawio (xml) в xml zabbix map?
- 2 подписчика
- 08 нояб.
- 135 просмотров
1

ответ
Python

Простой
Какой браузер с headless для python не распознаеться и не блокируеться google ai studio?
- 2 подписчика
- 31 окт.
- 259 просмотров
0

ответов
Python

Простой
Как сформировать изображение GS1 DataMatrix с функциональными знаками?
- 1 подписчик
- 31 окт.
- 146 просмотров
0

ответов
Python

+1 ещё

Простой
Почему callback_query_handler в telebot не работает?
- 1 подписчик
- 31 окт.
- 145 просмотров
3

ответа
Python

+1 ещё

Простой
Как исправить проблему с Docling?
- 1 подписчик
- 28 окт.
- 150 просмотров
0

ответов
Python

Простой
Что делать если turtle в python не отвечает?
- 1 подписчик
- 22 окт.
- 267 просмотров
2

ответа
Показать ещё Загружается…

Python Software Engineer - ML/LLM

Ennabl • Лимассол

от 650 000 ₽

Python back-end engineer (+Kotlin)

YoloPrice

от 360 000 до 420 000 ₽

Junior Python Developer

ITK academy • Воронеж

от 75 000 ₽

Очевидно pattern не верный.
https://regex101.com отличный сайт для тестирования регулярок.
Но как выше вам уже написал Pavel Denisov, лучше использовать lxml.

Answer 1 · 2018-08-26 12:30:03

>>> text = 'xxx <img width="550" height="550" src="link1" > yyy <img width="550" height="550" src="link2" /> zzz'
>>> re.findall(r'<img [^>]*src="([^"]*)"', text)
['link1', 'link2']

Answer 2 · 2018-08-26 12:14:29

re - это же целый модуль стандартной библиотеки. Он могёт всё, но к нему и на кривой козе не подъедешь.

Чем отличается re от replace в Python 3?

Войдите, чтобы написать ответ

Минуточку внимания

Войдите на сайт