Как правильно сформировать RegExp запрос?

Question

egocentrist @egocentrist

Python

Как правильно сформировать RegExp запрос?

Есть строчки вида:

"Indexhibit": {
			"website": "www.indexhibit.org",
			"cats": [ 1 ],
			"meta": { "generator": "Indexhibit" },
			"html": "<(?:link|a href) [^>]+ndxz-studio",
			"implies": [ "PHP", "Apache", "Exhibit" ]
		},
		"Glyphicons": {
			"website": "glyphicons.com",
			"cats": [ 17 ],
			"html": "(?:<link[^>]* href=[^>]+glyphicons(?:\\.min)?\\.css|<img[^>]* src=[^>]+glyphicons)"
		},
		"WordPress": {
			"website": "wordpress.org",
			"cats": [ 1, 11 ],
			"meta": { "generator": "WordPress( [\\d.]+)?\\;version:\\1" },
			"html": [ "<link rel=[\"']stylesheet[\"'] [^>]+wp-(?:content|includes)", "<link[^>]+s\\d+\\.wp\\.com" ],
			"env": "^wp_username$",
			"implies": "PHP"
		},

Пытаюсь экспой спарсить строку название движка и строку html. Т.е. получить результат вида:

Indexhibit "<(?:link|a href) [^>]+ndxz-studio"
Glyphicons "(?:]* href=[^>]+glyphicons(?:\\.min)?\\.css|]* src=[^>]+glyphicons)"
WordPress [ "]+wp-(?:content|includes)", "]+s\\d+\\.wp\\.com" ],

Наработки:

Вытаскиваю название: "(.*)": {$\n
Любая строка: ^\t\t\t".*": .*
Нужная строка: ^\t\t\t"html": (.*)

Как теперь это объеденить?

Вопрос задан более трёх лет назад
2392 просмотра

Комментировать

Подписаться 1 Оценить Комментировать

Решения вопроса 1

1 комментарий

Пригласить эксперта

Ваш ответ на вопрос

Войдите, чтобы написать ответ

Похожие вопросы

Python

+1 ещё

Простой
Как распарсить смешанный тип json-данных?
- 1 подписчик
- вчера
- 127 просмотров
3

ответа
Python

+1 ещё

Средний
Как «На лету» добавить клик id в готовый апк, который будет скачиваться с сайта?
- 1 подписчик
- вчера
- 92 просмотра
2

ответа
Python

+1 ещё

Средний
Как подключить отладчик к программе на Python в Docker-контейнере?
- 1 подписчик
- 24 июл.
- 133 просмотра
0

ответов
Python

Простой
Почему не получается создать профиль в программе Dolphin{anty}?
- 1 подписчик
- 24 июл.
- 74 просмотра
1

ответ
Python

Простой
Как совместить два .pdf файла?
- 1 подписчик
- 22 июл.
- 226 просмотров
0

ответов
Python

+1 ещё

Простой
Не доходит колбэк в колбекобработчик, как можно решить эту проблему?
- 1 подписчик
- 22 июл.
- 117 просмотров
1

ответ
Python

Простой
Почему AnaConda или MiniConda автоматически самоликвидируется на win10?
- 1 подписчик
- 22 июл.
- 105 просмотров
0

ответов
Python

+1 ещё

Простой
Почему форма не по центру экрана, как исправить?
- 1 подписчик
- 22 июл.
- 90 просмотров
0

ответов
Python

Простой
Как исправить Python error module 'win32crypt' has no attribute 'CryptProtectData' [closed]?
- 1 подписчик
- 21 июл.
- 78 просмотров
0

ответов
Python

+1 ещё

Простой
Как торговать фьючерсами через API MEXC?
- 2 подписчика
- 19 июл.
- 407 просмотров
1

ответ
Показать ещё Загружается…

Python разработчик

Bell Integrator • Москва

Разработчик Python

Bell Integrator • Москва

Python разработчик

Bell Integrator • Москва

Answer 1 · 2015-03-04 13:39:33

Это же обычный словарь. Если строчки берутся из файла:

import json
import codecs
from pprint import pprint

def ld(p, encoding="utf8"):
    u"""загрузка объекта"""
    with codecs.open(p, "rt", encoding=encoding) as f:
        return json.load(f)

json_dict = ld('my_file.json')
new_dict = dict()
for key in json_dict.keys():
    new_dict[key] = json_dict[key]['html']

pprint(new_dict)

Как правильно сформировать RegExp запрос?

Войдите, чтобы написать ответ

Минуточку внимания

Войдите на сайт