Есть строчки вида:
"Indexhibit": {
"website": "www.indexhibit.org",
"cats": [ 1 ],
"meta": { "generator": "Indexhibit" },
"html": "<(?:link|a href) [^>]+ndxz-studio",
"implies": [ "PHP", "Apache", "Exhibit" ]
},
"Glyphicons": {
"website": "glyphicons.com",
"cats": [ 17 ],
"html": "(?:<link[^>]* href=[^>]+glyphicons(?:\\.min)?\\.css|<img[^>]* src=[^>]+glyphicons)"
},
"WordPress": {
"website": "wordpress.org",
"cats": [ 1, 11 ],
"meta": { "generator": "WordPress( [\\d.]+)?\\;version:\\1" },
"html": [ "<link rel=[\"']stylesheet[\"'] [^>]+wp-(?:content|includes)", "<link[^>]+s\\d+\\.wp\\.com" ],
"env": "^wp_username$",
"implies": "PHP"
},
Пытаюсь экспой спарсить строку название движка и строку html. Т.е. получить результат вида:
Indexhibit "<(?:link|a href) [^>]+ndxz-studio"
Glyphicons "(?:]* href=[^>]+glyphicons(?:\\.min)?\\.css|]* src=[^>]+glyphicons)"
WordPress [ "]+wp-(?:content|includes)", "]+s\\d+\\.wp\\.com" ],
Наработки:
Вытаскиваю название: "(.*)": {$\n
Любая строка: ^\t\t\t".*": .*
Нужная строка: ^\t\t\t"html": (.*)
Как теперь это объеденить?