你可以这么写。 items = html.xpath('//div/p')[0] #获取<p>标签下的所有内容 item = items.xpath('string(.)') #用正则表达式匹配字符串 这样就可以获取<p>下的所有字段内容了,保留空格和换行符,那如果你想去掉换行符的话,再加一句, content = item.replace('\n','')
你可以这么写。
这样就可以获取<p>下的所有字段内容了,保留空格和换行符,那如果你想去掉换行符的话,再加一句,