Поискал по просторам, нашел только сервисы для обратных задач.
Есть (были) недобросовестные копирайтеры, которые "уникализировали" статьи заменой схожих киррилистических символов на латиницу. В результате у меня на руках полно статей вида
Пpи прямoй ингаляции маслa вдыхаютcя из флакона, или c салфетки, нa которую наносят несколькo капель. Этoт спосoб даeт болеe сильный эффект, чeм аромакурительница.
где в большинстве слов заменена 1 буква на латинскую.
пока смог только найти регулярку чтобы их найти в тексте, но как их автоматически заменить (учитывая, что надо исключить замену внутри < > чтобы не заменить символы в разных классах и т.д.
class="img-fluid mx-auto d-block"
)?
(?<=[A-Za-z])[а-яёі]|[а-яёі](?=[A-Za-z])