<h1>test world of world</h1>
<div>testworld of world</div>
<h1> test world of world</h1>
Необходимо написать регулярное выражение, чтобы найти все слова world внутри тега h1.
Сделал вот так: (?<=<h1>).*(world).*(?<=<\/h1>), но находит только первое слово.
Или может такую задачу нельзя решить регуляркой и нужно разбивать на две регулярки?
Здесь не совсем задача в парсинге html, нужно кое-что заменить внутри тегов script внутри большого проекта. Задачу можно по другому сформировать, найти все слова "тест" внутри кавычек.
Мой текст "тест про тест", часть текста, "два тест три тест", finish.
dzhuryn_volodymyr, "Внутри кавычек" - это тоже не регулярный язык. Регуляркой вы это не отловите.
Можно каким-нибудь split разбить на куски между кавычками, и потом во всех четных кусках искать встроенным replace. Если же в html работаете, то xml парсером нашли содержимое тега h1 а дальше хоть регуляркой, хоть встроенным replace работаете.
Николай Савельев, Слово "регулярные" в названии "регулярные выражения" - ключевое. Регулярные выражения нельзя применять для разбора нерегулярных языков. Поэтому парсить им HTML - плохая идея.
Николай Савельев, ты-б послушал опытного. Вообще HTML имеет больше уровней семантики чем просто тект. Я например могу создать html (абсолютно валидный) который на экране будет иметь "world" в нужных тегах но ты его регулярками не найдешь. И дело даже не в том что надо сбить спесь с зазнавшегося школьника. Просто жизнь или исходные данные могут однажды тебя неприятно шокировать.
Поэтому слушай что советуют и сам не включай менторский тон.