berezuev
@berezuev
#define TRUE FALSE

Python, как пофиксить регулярку?

Есть такой исходник pastebin.com/9mq2eJyJ (страница товара на ebay).
Нужно вытащить из нее все картинки.
пробую такую регулярку:
\"maxImageUrl\"\:\"(.+)\"
Но она цепляет все после (.+) (хотя, по идее, должна на кавычке стопориться).
ЧЯДНТ?

upd: воспроизвести можно здесь: pythex.org
  • Вопрос задан
  • 530 просмотров
Решения вопроса 1
berezuev
@berezuev Автор вопроса
#define TRUE FALSE
А вот и ответ:
\"maxImageUrl\"\:\"([^\"]+)
Ответ написан
Пригласить эксперта
Ответы на вопрос 2
@Alexander1705
\"maxImageUrl\"\:\"(?:.+)\"
Ответ написан
sim3x
@sim3x
re.findall('maxImageUrl":"([^"]+)"', text)
Out[11]: 
['http:\\u002F\\u002Fi.ebayimg.com\\u002F00\\u002Fs\\u002FMTAwMFg3NTA=\\u002Fz\\u002F1qwAAOSwLVZV0i6g\\u002F$_57.JPG',
 'http:\\u002F\\u002Fi.ebayimg.com\\u002F00\\u002Fs\\u002FMTAwMFg3NTA=\\u002Fz\\u002FFCEAAOSw9N1V0i6h\\u002F$_57.JPG',
 'http:\\u002F\\u002Fi.ebayimg.com\\u002F00\\u002Fs\\u002FMTAwMFg3NTA=\\u002Fz\\u002F5HIAAOSwMmBV0i6i\\u002F$_57.JPG',
 'http:\\u002F\\u002Fi.ebayimg.com\\u002F00\\u002Fs\\u002FMTAwMFg3NTA=\\u002Fz\\u002F1qwAAOSwLVZV0i6g\\u002F$_57.JPG',
 'http:\\u002F\\u002Fi.ebayimg.com\\u002F00\\u002Fs\\u002FMTAwMFg3NTA=\\u002Fz\\u002FFCEAAOSw9N1V0i6h\\u002F$_57.JPG',
 'http:\\u002F\\u002Fi.ebayimg.com\\u002F00\\u002Fs\\u002FMTAwMFg3NTA=\\u002Fz\\u002F5HIAAOSwMmBV0i6i\\u002F$_57.JPG',
 'http:\\u002F\\u002Fi.ebayimg.com\\u002F00\\u002Fs\\u002FMTAwMFg3NTA=\\u002Fz\\u002F1qwAAOSwLVZV0i6g\\u002F$_57.JPG',
 'http:\\u002F\\u002Fi.ebayimg.com\\u002F00\\u002Fs\\u002FMTAwMFg3NTA=\\u002Fz\\u002FFCEAAOSw9N1V0i6h\\u002F$_57.JPG',
 'http:\\u002F\\u002Fi.ebayimg.com\\u002F00\\u002Fs\\u002FMTAwMFg3NTA=\\u002Fz\\u002F5HIAAOSwMmBV0i6i\\u002F$_57.JPG']
Ответ написан
Комментировать
Ваш ответ на вопрос

Войдите, чтобы написать ответ

Войти через центр авторизации
Похожие вопросы