UPD. в процессе написания понял, что можно это всё сделать с помощью функций str..., но всё же хотелось бы узнать, возможно ли всё реализовать на регулярках?
Чтоб сервер не скучал и напрягался на регулярки которые жрут ресурсы как слон?
Ни примера текста, ни какие теги и т.п.
Скорее всего самый лучший вариант как обычно DOM парсер, а не регулярки.
Может скрипт сохранить в правильной кодировке UTF-8?
Ну и смотря где выводить, в консоли например, просто так не выведется русский язык.
В браузере еще правильный мета тег с кодировкой указать желательно.