Есть много таких строк:
www.site.ru sale@site.ru +7 926 33-2222-11123 Москва
Мне нужно достать оттуда адрес сайта. Сайты могут быть такими:
https://www.site.ru
site.ru <-- тут хттп.site.ru, просто парсер хабра немного портит ссылки
site.ru
www.site.ru
Искал в google(и ru и eng) по пять страниц прошел, далее смысла нет. Половина регулярок не работает. 90% из работающих ищут с https или http.
PS: Порядок данных в файле разный.
PS: Придумал еще так:
сплитить строку по пробелу, далее strip(), далее проверять каждый элемент списка на наличие точки и отсутствии собачки? Что думаете по этому поводу? Мне в принципе на один раз, ведь данные уже загружены, сейчас обрабатываю. Или регулярку, что лучше?