Как можно получить все ссылки из текста в виде массива?

Question

ILoveYAnny @ILoveYAnny

Как можно получить все ссылки из текста в виде массива?

Здравствуйте, у меня есть текст, в котором встречается ссылки без разметки, вида site.ru
и https://site.ru и site.ru, при чём как минимум название доменов могут поменяться и доменной зоны, возможно будет подписано www. и может существовать поддомен. Можно ли как-то наверняка вытащить все ссылки в массив, мб есть какая-то библиотека?

Я пытаюсь найти регуляркой, однако такая конструкция не работает:

$testLinks = "ddd site.com";
preg_match(' /^(https?:\/\/)?([\w\.]+)\.([a-z]{2,6}\.?)(\/[\w\.]*)*\/?$/', $testLinks, $matches);

А вот ели на вход подать только сайт
$testLinks = "site.com";
всё работает отлично...

Вопрос задан более трёх лет назад
372 просмотра

Комментировать

Подписаться 1 Простой Комментировать

Помогут разобраться в теме Все курсы

Нетология

Веб-разработчик с нуля: профессия с выбором специализации

14 месяцев

Далее
Stepik

PHP (pro)

2 недели

Далее
Хекслет

PHP-разработчик

10 месяцев

Далее

Решения вопроса 2

4 комментария

ILoveYAnny @ILoveYAnny Автор вопроса

Проблема в том, что это как бы не Дом элемент, не тэг. Это текст вида ссылки)

Написано более трёх лет назад
Exploding @Exploding

ILoveYAnny, Ну, а можете привести пример этой "ссылки" в обычном ее виде, т.е. как она выгладит в большинстве случаев, и пример варианта - в самом худшем и геморном виде?

Написано более трёх лет назад
Exploding @Exploding

ILoveYAnny, обновил ответ

Написано более трёх лет назад
ILoveYAnny @ILoveYAnny Автор вопроса
Exploding, Спасибо! Ваш пример будет работать, но разбивать весь текст по словам и жёстко закреплять ссылку не лучшее решение. Вот то, что меня спасло)

$text = "мой текст site.com"; preg_match_all('/(https?:\/\/)?([\w\.]+)\.([a-z]{2,6}\.?)(\/[\w\.]*)*\/?/', $text, $a); print_r($a[0]);
Написано более трёх лет назад

Комментировать

Пригласить эксперта

Ответы на вопрос 1

2 комментария

ILoveYAnny @ILoveYAnny Автор вопроса
Я пошёл таки путём, но возникла проблема
Вот таким образом всё хорошо:
$testLinks = "site.com"; preg_match(' /^(https?:\/\/)?([\w\.]+)\.([a-z]{2,6}\.?)(\/[\w\.]*)*\/?$/', $testLinks, $matches);

А так не работает:
$testLinks = "ddd site.com"; preg_match(' /^(https?:\/\/)?([\w\.]+)\.([a-z]{2,6}\.?)(\/[\w\.]*)*\/?$/', $testLinks, $matches);
Написано более трёх лет назад
Exploding @Exploding

ILoveYAnny,
ddd site.com

Что это такое?
Вы говорили что надо урлы. Что за ДДД еще? Там или точка пропущена или это ДДД к урлу не относится.

Написано более трёх лет назад

Ваш ответ на вопрос

Войдите, чтобы написать ответ

Похожие вопросы

Веб-разработка

+2 ещё

Средний
Как создавать нормальный B2B SaaS? Есть ли какие то ру курсы/литература? Насколько углубленные знания языка программирования должны быть?
- 2 подписчика
- 16 июл.
- 200 просмотров
6

ответов
PHP

Средний
Как исправить ошибки шаблона WP?
- 1 подписчик
- 14 июл.
- 112 просмотров
1

ответ
Веб-разработка

+4 ещё

Простой
Как хранить публичный медиа-контент сайта?
- 2 подписчика
- 03 июл.
- 284 просмотра
3

ответа
Веб-разработка

Простой
В какой программе/сайте можно создать и выгрузить html сайт?
- 3 подписчика
- 21 июн.
- 930 просмотров
3

ответа
PHP

Средний
Как сделать что бы переменная avatar($ank['id']); не конфликтовала с другим файлом?
- 2 подписчика
- 17 июн.
- 214 просмотров
2

ответа
PHP

+2 ещё

Средний
Как решить проблему с smtp сервером?
- 1 подписчик
- 03 июн.
- 469 просмотров
1

ответ
Веб-разработка

+2 ещё

Средний
Как избежать вездесущего agentic coding и остаться в IT?
- 8 подписчиков
- 01 июн.
- 3784 просмотра
12

ответов
PHP

Средний
Как составить регулярное выражение?
- 1 подписчик
- 31 мая
- 252 просмотра
2

ответа
PHP

+2 ещё

Простой
Как настроить php_curl для php8 под windows?
- 1 подписчик
- 28 мая
- 197 просмотров
3

ответа
Веб-разработка

+2 ещё

Средний
Как правильно хранить видео в Django?
- 2 подписчика
- 28 мая
- 475 просмотров
3

ответа
Показать ещё Загружается…

Answer 1 · 2017-10-27 17:02:22

Можно как-то наверняка вытащить все ссылки в массив, и даже есть какая-то библиотека: html_dom_parser, nokogiri:) Других не помню, эти считаются самыми лучшими

UPD:
Я так понимаю, что ссылки нужны в рамках текущего домена? Хотя, это уже ваши проблемы))
В общем, вот, как говорится "на коленке"... у Еленки)) Там уже кавычки, тримы и т.д. уже допилите если я правильно понял задачу.

$text = "слова и предложения! б ура! я копирайтером сталъ!, э, куда пошелъ!Ё----:: site.ru 1 site.ru 2 site.ru 3 ТРИ*** ХАДы или вот ВВВ гаварю надежны -> https://www.site.ru - nj;t ehf (тоже ура!).";
		$words = explode(" ", $text);
		$urls = array();
		foreach($words as $k)
			if(strstr($k, "site.ru")) $urls[] = $k;
		$urls = array_unique($urls);
		echo implode(", ", $urls);
		// site.ru, https://www.site.ru

Answer 2 · 2017-10-27 22:35:20

ILoveYAnny @ILoveYAnny Автор вопроса

$text = "мой текст site.com";
preg_match_all('/(https?:\/\/)?([\w\.]+)\.([a-z]{2,6}\.?)(\/[\w\.]*)*\/?/', $text, $a);
print_r($a[0]);

Ответ написан более трёх лет назад

Комментировать

Answer 3 · 2017-10-27 17:05:57

Евгений @EShein

Shein

Регулярным выражение находите url и пушите в массив.

Ответ написан более трёх лет назад

2 комментария

Как можно получить все ссылки из текста в виде массива?

Войдите, чтобы написать ответ

Минуточку внимания

Войдите на сайт