Здравствуйте!
Есть html код, полученный из страницы с помощью urllib2:
import urllib2
url = 'http://localhost/test.txt'
username = '1'
password = '2'
p = urllib2.HTTPPasswordMgrWithDefaultRealm()
p.add_password(Realm, url, username, password)
handler = urllib2.HTTPBasicAuthHandler(p)
opener = urllib2.build_opener(handler)
urllib2.install_opener(opener)
f = urllib2.urlopen(url)
parsed = f.read()
Полученный HTML код:
<td class="tdrow1">
<a class="aaa">#</a>
<a class="aaa">#</a>
<a class="aaa">#</a>
<a class="aaa">#</a>
<a class="aaa">#</a>
</td>
Весь код сохранен в переменную parsed.
Вопрос:
1. Как убрать все теги "a" с помощью lxml или BeautifulSoup (или другие ваши решения)?
2. Как убрать теги с определенным классом, например, в моем случае "aaa"?
Спасибо.
(вопросы от новичка в мире python)