Как вытянуть размеры обуви\одежды с помощью python regexp?
Всем привет!
Столкнулся со следующей проблемой:
Нужно вытянуть размеры одежды\обуви из select option в хтмл, каждая из которых может иметь следующий вид:
US Men's 11 M (Regular) - $54.95
US Men's 8 X (Regular) - $54.95
US Men's 8.5 X (Regular) - $54.95
COGNAC 10 - $49.99
COGNAC 10.2 - $49.99
Carolina Blue L - $19.99
Carolina Blue XL - $19.99
Carolina Blue 3XL - $19.99
Мне нужно, чтоб extracted string была в таком виде:
11 M
8 X
8.5 X
10
10.2
L
XL
3XL
Как это сделать, чтобы не изобретать велосипед? Спасибо!
semolex: Я не совсем понимаю, как именно в элементе расположен этот текст. Можете показать на jsfiddle структуру элемента с содержанием?
Можно проапдейтить мой пример, только добавьте html-код того, что у вас есть. Только нужный кусок, всю страницу не нужно:(
semolex: Если вы хотите использовать регулярку на сервере и непременно в Python, то я вам не помогу. Сами по себе регулярки почти одинаковы (за исключением некоторых вещей), но методы, их использующие, отличаются в разных языках.
Я могу только показать, как это работает на клиенте в Javascript.
Так результат и будет примерно таким (просто везде выбирать [index][0])
Либо, можно реплейсом убрать везде (Regular)
import re
priceList = """US Men's 11 M (Regular) - $54.95
US Men's 8 X (Regular) - $54.95
US Men's 8.5 X (Regular) - $54.95
COGNAC 10 - $49.99
COGNAC 10.2 - $49.99
Carolina Blue L - $19.99
Carolina Blue XL - $19.99
Carolina Blue 3XL - $19.99""".replace("(Regular)", "")
print(re.findall("([0-9 M X L\.]+) - \$[0-9][0-9].[0-9][0-9]", a))