xpath匹配标签下面所有内容文字

阅读 1 分钟

0

在我们利用xpath匹配页面标签时，经常会遇到标签下面还包含标签，但是我们只想取下面的所有文字

例如相匹配图中 div[@class='display-content']下面所有P的文字，此时我们可以利用这个方法

图片描述

直接上代码

def get_details(url):
    text_response = requests.get(link)
    print('编码格式', text_response.encoding)
    encode_rsp = text_response.encoding
    response = text_response.text.encode(encode_rsp).decode('utf-8')
    text = etree.HTML(response)
    tt = text.xpath("//div[@class='display-content']")
    text_info = tt[0].xpath("string(.)")
    return text_info

返回结果如图
图片描述

xpath lxml python爬虫

阅读 6.4k更新于 2019-07-01

瑞0908

321 声望77 粉丝

一个一个解决

« 上一篇

下一篇 »

centos 安装anaconda3

引用和评论

推荐阅读

windows删除文件提示文件不存在解决办法

瑞0908阅读 135

如何对接韩国和日本股票数据源API

CryptoRzz阅读 706

douyin_search_comment_tool | 2025自研python软件采集抖音评论区数据

马哥python说阅读 633

【GUI软件】调用YouTube的API接口，采集关键词搜索结果，并封装成界面工具！

马哥python说阅读 602

深入研究：淘宝天猫商品详情查询API详解

Odin阅读 578

虾皮Shopee商品信息采集

呵呵人生阅读 555

【爬虫工具】2025微博采集软件，根据搜索关键词批量爬帖子，突破50页限制！

马哥python说阅读 457

0 条评论

评论支持部分 Markdown 语法：**粗体** _斜体_ [链接](http://example.com) `代码` - 列表 > 引用。你还可以使用 @ 来通知其他用户。