lppxx
@lppxx
Software engineer

Корректно ли регулярка?

Информация:
Есть определенный сайт, откуда я беру данные (видео). Функция парсинга работает нормально, если указать cсылку в requests.get(url). Но я хочу в дальнейшим использовать данную функцию в другом месте, так что мне надо регулярное выражение, чтобы я ожидал от пользователя разные значения, и все работало без перебоев.

Описание:
Есть вот такая ссылка: https://example.com/serial/season-2/episode-3.html и https://example.com/serial/episode-1.html.
То есть, дело в том, что ссылки разные, некоторые ссылки не имеют части season-X (вместо X любое число). И проблема сезонов и серий заключается в том, что они могут достигать 200, либо 10, разные.
url = r'^https://(example\.com)/\w+/(episode-\d+|season-\d+/episode-\d+).html$'

И конечно же в конце каждой ссылки есть .html, и больше ничего.

Можете помочь оформить регулярное выражение, и объяснить ваше изменение.
  • Вопрос задан
  • 79 просмотров
Решения вопроса 1
Пригласить эксперта
Ответы на вопрос 1
@zkrvndm
Боты, парсеры, расширения
Используйте квантификатор вопросительный знак, чтобы указать, что какая-то часть регулярки может как присутствовать, так и отсутствовать.
Ответ написан
Ваш ответ на вопрос

Войдите, чтобы написать ответ

Войти через центр авторизации
Похожие вопросы