Dunaevlad
@Dunaevlad

Как удалить символы до определенного символа?

import re

url = 'https://www.gutesache.be/organisation/?id=0597974811&SearchTerm=social&Citydistance=5&searchlang=nl'
#  надо удалить все символы до 3-его слеэша.

Дополню код:
for tag in soup.find_all('div', class_='content'):
    link = tag.find('a').get('href')  # поставить здесь re.sub ? что бы убрать https://www.bonnescauses.be или 
                                                 # https://www.gutesache.be
    print(link)

# https://www.bonnescauses.be/organisation/?id=0659660475&SearchTerm=social&Citydistance=5&searchlang=nl
# https://www.bonnescauses.be/organisation/?id=0450059610&SearchTerm=social&Citydistance=5&searchlang=nl
# /organisation/?id=0407231239&SearchTerm=social&Citydistance=5
# /organisation/?id=0416602429&SearchTerm=social&Citydistance=5
# https://www.gutesache.be/organisation/?id=0597974811&SearchTerm=social&Citydistance=5&searchlang=nl
# /fund/?id=F2911810&SearchTerm=social&Citydistance=5
# /fund/?id=D1811060&SearchTerm=social&Citydistance=5


Ссылки при парсинге выдаются по разному, поэтому я хочу убрать все до 3-его слэша.
  • Вопрос задан
  • 115 просмотров
Решения вопроса 1
fox_12
@fox_12 Куратор тега Python
Расставляю биты, управляю заряженными частицами
Иногда без регулярок бывает проще:
data = 'https://www.gutesache.be/organisation/?id=0597974811&SearchTerm=social&Citydistance=5&searchlang=nl'

'/'.join(data.split('/')[3:])
# organisation/?id=0597974811&SearchTerm=social&Citydistance=5&searchlang=nl
Ответ написан
Комментировать
Пригласить эксперта
Ответы на вопрос 2
SoreMix
@SoreMix Куратор тега Python
yellow
Обязательно regex?

new_url = '/'.join(url.split('/')[3:])
Ответ написан
Nikcet
@Nikcet
Использовать срез строки от начала строки. Скорее всего, https://www.gutesache.be/ будет постоянной, поэтому можно смело использовать срез.
url[25:]
Ответ написан
Ваш ответ на вопрос

Войдите, чтобы написать ответ

Войти через центр авторизации
Похожие вопросы