Как достать UTM-метки из URL, если прописаны они не во всех случаях?

Question

Albion26 @Albion26

Python

Как достать UTM-метки из URL, если прописаны они не во всех случаях?

Суть проблемы: у меня есть большой список доменов.
Пример:

list_url = [{'id': '7a8809acc2b249b7a868a49b89793cc9',
'url': 'https://mysite.com/utm_source=facebook&utm_medium=cpc'},
{'id': '7a8809acc2b249b7a868a49b89793cc4',
'url': 'https://mysite.com/contacts'}]

Я перебираю каждый из них и записываю в отдельный словарь id, url, source, medium если прописаны UTM-метки, делаю я это, через регулярные выражения.

'url': list_url['url'],
'source' : re.findall('(?<=utm_source=).*(?=&utm_medium)',list_url['url']),
'medium' : re.findall('(?<=utm_medium=).*(?=&utm_campaign)',list_url['url'])

Если использовать метод findall в source, medium записывается список, чтобы достать значение из него я могу обратиться к нулевому элементу, но в этом случае отбрасываются все случаи, где нет значений source, medium.
Как можно прописать условие замены пустых значений списка на None.
В общем по итогу, я должен получить следующее:

[{'id': '7a8809acc2b249b7a868a49b89793cc9',
'url': 'https://mysite.com/utm_source=facebook&utm_medium=cpc',
'source': 'facebook',
'medium' : 'cpc'},

'{id': '7a8809acc2b249b7a868a49b89793cc4',
'url': 'https://mysite.com/contacts',
'source' : None
'medium' : None}]

Вопрос задан более трёх лет назад
476 просмотров

Комментировать

Подписаться 1 Простой Комментировать

Помогут разобраться в теме Все курсы

Нетология

Python-разработчик: расширенный курс + нейросети

12 месяцев

Далее
Академия Эдюсон

Python-разработчик + ИИ

9 месяцев

Далее
ProductStar × РБК

Профессия: Python-разработчик + ИИ

8 месяцев

Далее

Решения вопроса 1

1 комментарий

Пригласить эксперта

Ваш ответ на вопрос

Войдите, чтобы написать ответ

Похожие вопросы

Python

+1 ещё

Простой
Почему разрывается подключение к бд на сервере?
- 1 подписчик
- 18 июн.
- 194 просмотра
1

ответ
Python

+2 ещё

Средний
Как новичку найти первые заказы на парсинг данных (Python)?
- 1 подписчик
- 17 июн.
- 495 просмотров
2

ответа
Python

+1 ещё

Сложный
Как на Python реализовать алгоритм, чтобы персонаж шёл по определенному маршруту в Genshin Impact?
- 3 подписчика
- 15 июн.
- 475 просмотров
2

ответа
Python

+1 ещё

Средний
Может кто помочь исправить код LTSM нейросети?
- 1 подписчик
- 12 июн.
- 274 просмотра
2

ответа
Python

+1 ещё

Средний
Telethon отказывается соединятся с серверами Telegram, как это обойти?
- 1 подписчик
- 10 июн.
- 486 просмотров
1

ответ
Python

+1 ещё

Простой
Почему копируется атрибут при создании нового экземпляра?
- 1 подписчик
- 08 июн.
- 208 просмотров
2

ответа
Python

+2 ещё

Простой
Как правильно настроить статические и медиафайлы на хостинге?
- 1 подписчик
- 04 июн.
- 124 просмотра
1

ответ
Python

Простой
Как отправить видео в мессенджер MAX с прогрессом загрузки Python (tqdm)?
- 2 подписчика
- 30 мая
- 329 просмотров
1

ответ
Python

Простой
Стоит ли переходить на IDE?
- 1 подписчик
- 25 мая
- 657 просмотров
5

ответов
Python

+2 ещё

Простой
Где хранить сессию SQLAlchemy в FastAPI: в конструкторе сервиса или передавать в каждый метод?
- 2 подписчика
- 23 мая
- 343 просмотра
1

ответ
Показать ещё Загружается…

Answer 1 · 2020-06-22 01:09:24

soremix @SoreMix Куратор тега Python

yellow

def parse(mark, url):
    result = re.search(r'utm_{}=(.+?)(&|$)'.format(mark), url)
    if result:
        return result.group(1)
    return None

'source' : parse('source', list_url['url'])

Ответ написан более трёх лет назад

1 комментарий

Как достать UTM-метки из URL, если прописаны они не во всех случаях?

Войдите, чтобы написать ответ

Минуточку внимания

Войдите на сайт