Какая регулярка может выбрать все слова из текста независимо от языка текста и кодировки?
Здравствуйте.
Есть проект на php, нужно доставать из текста все слова.
Какой регуляркой можно выбрать все слова из текста независимо от языка текста и кодировки?
сейчас использую вот такую - #\b[^\s]+\b#ui
Но она не работает с русскими текстами. Если убрать u , то работает с русскими текстами и не работает с англйискими, или наоборот, точно не помню.
if (preg_match('#\b[^\s]+\b#ui', $content, $matches)) {
// Английские слова
} elseif (preg_match('#\b[^\s]+\b#i', $content, $matches)) {
// Русские слова
}