html = """
{a href="http://www.baidu.com/" target="_blank">
{img src="<%=BLOG%>image/logo.gif" height="31" width="88" border="0" alt="test" />
"""
soupHtml = BeautifulSoup(html)
print soupHtml
注:由于代码无法显示出来,所以就将 标签a和img分别改成 {a、{img
输出结果:
很明显,以上结果是错误的,错在img标签结束符位。
导致print soupHtml.img的结果如下:
有BeautifulSoup的问题是少不了我凑个热闹的。
不过这个问题真是让我无语到要爆发……
<
,>
等东西的时候需要转义成HTML实体& lt;
,& gt;
等。http://paste.openstack.org/show/60873/