Рекомендую почитать что-нибудь про работу с древовидными структурами данных или про парсинг JSON-строки, потому что ваша задача как раз об этом. Могу посоветовать воспользоваться библиотекой
htmlparser2, там вы можете контролировать парсинг по необходимых тегам или их атрибутам. В качестве эксперимента можно попробовать вырезать
<code>*</code>
, но главное не забыть позицию, чтобы потом поставить обратно