Как обернуть в теги некоторые слова в HTML?

Question

Johnick @Johnick

Как обернуть в теги некоторые слова в HTML?

Есть переменная с html разметкой. Необходимо написать регулярное выражение для «обертывания» слов и фраз из подготовленного массива. Но нужно из данного выражения исключить теги с определенными классами или как-то избежать дублирования (подробнее ниже).
Например . Есть html

<div>
<span style="font-size:12px;">
<strong>Второе правило</strong> - надо действовать. Вместо того, чтобы жаловаться на абсурдность  мира, 
постараемся преобразить тот уголок, куда забросила нас судьба.
</span>
</div>

Есть массив со словами:
['правило', 'мир', 'уголок']

После замены должно получиться следующее:

<div>
<span style="font-size:12px;">
<strong>Второе <span class="glossary-term" data-toggle="tooltip" data-placement="right" title="тут подсказка">правило</span></strong> - надо действовать. 
Вместо того, чтобы жаловаться на абсурдность  мира, постараемся преобразить тот <span class="glossary-term" data-toggle="tooltip" data-placement="right" title="тут подсказка">уголок</span>, 
куда забросила нас судьба.
</span>
</div>

При помощи такой регулярки, частично это получилось сделать, но осталось пара проблем:

new RegExp(`(?<!<[^>]*?)(${word}\\S*)(?<!<[^>]*?)`, 'ig')

1. В массиве слово «мир», но при использовании этой регулярки, заменяются все слова, в которых есть «мир» (в тексте «мира»). Нужно чтобы замена происходила, только при полном совпадении.
2. Если в атрибуте title присутствует слово из массива, то происходит повторное «оборачивание» в этот тег.

function f(text) {
    let newText = text.html();
    let array = ['правило', 'мир', 'уголок'];
    array.forEach(word=> {
        let regex = new RegExp(`(?<!<[^>]*?)(${word}\\S*)(?<!<[^>]*?)`, 'ig');
        newText = newText.replace(regex, `<span class="hint" data-toggle="tooltip"
             data-placement="right" title="тут подсказка">$1</span>`);
    })
    return newText;
}

Как можно доработать эту регурярку или может есть другие решения данной задачи?

Вопрос задан более трёх лет назад
525 просмотров

Комментировать

Подписаться 1 Простой Комментировать

Помогут разобраться в теме Все курсы

Skillbox

JavaScript

3 месяца

Далее
Яндекс Практикум

Фронтенд-разработчик расширенный

13 месяцев

Далее
Академия Eduson

Fullstack-разработчик на JavaScript

11 месяцев

Далее

Решения вопроса 1

7 комментариев

Johnick @Johnick Автор вопроса

Спасибо за помощь. Ваш код работает, озвученных мною проблем пока не наблюдаю. Но в некоторых местах появляется такая ошибка:

DOMException: Failed to execute 'setStart' on 'Range': The offset 82 is larger than the node's length (32).

Пример абзаца (к ошибки выше):

<p><span style="font-size:14px;"><span style="font-family:Arial,Helvetica,sans-serif;"><b style="font-family: Arial, Helvetica, sans-serif; font-size: 14px;">Инвалид</b>&nbsp;<span style="line-height:normal">–&nbsp;</span>человек, у которого возможности его жизнедеятельности в обществе ограничены из-за его физических, умственных, сенсорных или психических отклонений.</span></span></p>

Заменяемое слово:
['его']

Если данное место кода обернуть в try catch, то замена двух слов «его» в тексте происходит нормально. В catch попадают следующие парметры:

currentNode = 'человек, у которого возможности ';
length = 3;
offset = 82;

Написано более трёх лет назад

Johnick @Johnick Автор вопроса
И самое главное забыл написать это возможно происходит из-за того что Ваш код критится в цикле, т.е.
сначала один массив со словами прогоняется, потом второй и т.д.

... ['правило', 'мир', 'уголок'] ['его'] ...
Написано более трёх лет назад
Johnick @Johnick Автор вопроса

Все разобрался, мой косяк. Пока пробовал встраивать, добавил букву g в регулярку из-за этого эта ошибка и появлялась. На следующей неделе еще более детально протестирую. Спасибо.

Написано более трёх лет назад
Johnick @Johnick Автор вопроса

Приветствую.

Появилась проблема. Если текст очень большой (и при увеличении массивов со словами, думаю, тоже это будет актуально), в моем случае попался ~10Мб, то обработка занимает около 15-20 секунд. Можно ли сделать эту обработку асинхронной, чтобы окно не блокировалось во время обработки, т.е. при загрузке текста выводить его без подсказок, а потом заменять его на обработанный?

Пробовал такие варианты: setTimeout (окно блокируется или я не понял, как сделать), web worker (нет доступа к DOM), async/await (пока получил, только утечку памяти).

Написано более трёх лет назад
Сергей Соколов @sergiks Куратор тега JavaScript

Johnick, web worker: ему передать исходную строку, от него получить с заменами – и вставить в DOM. Во время обработки воркером, UI тормозить не будет.

Написано более трёх лет назад
Johnick @Johnick Автор вопроса

В воркерах нет доступа к document. Как минимум создание элементов document.createElement('template') точно не работает. Даже если я передам уже созданные элементы вместе с исходным html, то манипулировать этими элементами (например: div.appendChild(fragment)) я скорей всего не смогу или я ошибаюсь?

Написано более трёх лет назад
Сергей Соколов @sergiks Куратор тега JavaScript

Johnick, а, точно, в воркере же недоступен Document API.. Поспешил предложить..

Может, создать для этого iframe? При некоторых условиях он работает в отдельном треде.

Написано более трёх лет назад

Пригласить эксперта

Ваш ответ на вопрос

Войдите, чтобы написать ответ

Похожие вопросы

JavaScript

+2 ещё

Средний
E2EE + WEB = поищем безопасность?
- 1 подписчик
- 20 дек.
- 229 просмотров
2

ответа
JavaScript

Средний
Как сделать, чтобы легенды не «наежали» на график?
- 1 подписчик
- 19 дек.
- 119 просмотров
1

ответ
JavaScript

+2 ещё

Средний
Как можно реализовать что то вроде селекта внутри родителя у которого есть скрытые элементы и должна быть горизонтальная прокрутка?
- 2 подписчика
- 11 дек.
- 171 просмотр
0

ответов
JavaScript

+1 ещё

Простой
Как идентифицировать проксированные ошибки?
- 1 подписчик
- 05 дек.
- 142 просмотра
1

ответ
JavaScript

+2 ещё

Простой
Как сделать резкое переключение слайдов?
- 1 подписчик
- 03 дек.
- 187 просмотров
0

ответов
JavaScript

Простой
Как сделать чтоб условия не перезаписывались?
- 1 подписчик
- 02 дек.
- 258 просмотров
1

ответ
JavaScript

+2 ещё

Простой
Элемент стилизации на js, как сделать чтобы не было резкой смены картинки фона?
- 1 подписчик
- 27 нояб.
- 231 просмотр
1

ответ
JavaScript

Простой
Переход по ссылке с параметром на конкретный узел в vis.js?
- 1 подписчик
- 24 нояб.
- 121 просмотр
0

ответов
JavaScript

+1 ещё

Простой
Как сделать сложную виртуализацию?
- 1 подписчик
- 22 нояб.
- 301 просмотр
2

ответа
JavaScript

Простой
В цикле for много кнопок как сделать .addEventListener('click', к каждой кнопке?
- 1 подписчик
- 16 нояб.
- 327 просмотров
3

ответа
Показать ещё Загружается…

Fullstack JavaScript разработчик

MakeDifference

от 60 000 до 110 000 ₽

Frontend-разработчик (Vanilla JS, high-load media platform)

Karma8

от 200 000 до 300 000 ₽

React разработчик

ITK academy • Нижний Новгород

от 50 000 до 90 000 ₽

Answer 1 · 2022-11-25 23:52:18

Попробовал сделать через DocumentFragment, рекурсивный обход текстовых Node
и обёртку найденных слов с помощью Range.surroundContents()

Получилось как-то переусложнённо. Но наверное лучше, чем регуляркой HTML разбирать: не станет менять слова в атрибутах тегов. Раз уж это разметка, можно работать с DOM.
Слабое место – не обошлось без регулярного выражения для поиска слов. Т.к. там кириллица, привычные \b для границы слова не работают, пришлось заглядывать впрёд-назад, и регулярка вышла некороткая.

Криво-длинно, но работает:

Из исходного HTML делается DocumentFragment — как DOM полноценного документа. Перебираются его узлы. Если узел не-текстовый, рекурсивно перебираем его дочерние узлы.
В текстовых узлах ищем искомые слова.

Найденное слово (по одному за раз) заменяется на обёртку с этим словом.
Вместо 1 исходного текстового узла, у нас становится уже 3: текст-элемент-текст.
Далее поиск повторяется с хвостовым остатком текста – третьим (текстовым) узлом, пока в тексте не останется искомых слов для замены.

Решение не лаконичное и не простое. Если возникнут вопросы, пишите, постараюсь объяснить.

Как обернуть в теги некоторые слова в HTML?

Войдите, чтобы написать ответ

Минуточку внимания

Войдите на сайт