关于PYTHON抓取网页内容的问题

我想抓取这个网页 http://blog.sina.com.cn/s/blo... 中文章末尾的阅读数量

阅读(332)┊ 评论 (0)┊ 收藏(0)

网页源码：

阅读<span id="r_6f72ff900102xqgi" class="SG_txtb"></span>

源码里没有值。

我用的pyquery这个库，代码如下：

url = 'http://blog.sina.com.cn/s/blog_6f72ff900102xqgi.html'

doc = pq(url=url, encoding='utf-8')

print(doc('#r_6f72ff900102xqgi') )

代码输出的结果：

<span id="r_6f72ff900102xqgi" class="SG_txtb"></span>

需要怎么做才能得到页面里的阅读量数字呢？

阅读 2.5k

3 个回答

得票最新

✓ 已被采纳

应该是js获取的动态数据

获取结果

requestId_57944281={"pv":773757,"av":362}

阅读数和这个av的值一样。

阅读量数字我以前看过一些视频，有可能是在返回的json中存放的，可以打开F12看一下有没有返回json数据。

首先得确认阅读数量是动态数据（异步发送请求获取，例如ajax）还是静态数据（同步加载渲染）

撰写回答

推荐问题

相似问题

找不到问题？创建新问题