Помогите, пожалуйста, правильно составить регулярное выражение, которое может вытаскивать из текста только текст (a-zA-Zа-яА-Я), цифры (0-9), знак подчеркивания (_) и emoji (вот тут хз). Пробовал разные варианты - не очень как-то работает, все не так как надо. Не силен в регулярках.
Скрипт должен вытаскивать хештеги из описания картинки инстаграма.
Пока делаю так, но очень много символов не учтено.
preg_match_all("/(?<=#)([^\\s\\t#?!;\.\'\":<>,\\n]+)/u", $caption, $tags_match);