python读取网页内容的问题

Question

python读取网页内容的问题

发布于
2018-04-03

更新于
2018-04-03

首先网页源码（HTML）是这样的：

阅读<span id="r_6f72ff900102xqgi" class="SG_txtb"></span>

网页打开的时候显示的内容为 “阅读251”，那就说明阅读两个字后面的SPAN是阅读数量的数字。

我用的PyQuery库来GET网页内容，代码如下：

from pyquery import PyQuery as pq
 
d = pq(url='http://blog.sina.com.cn/s/blog_6f72ff900102xqgi.html')
print(d('span').filter('#r_6f72ff900102xqgi') )

然而打印出来的并不是数字，而是SPAN的HTML：

<span id="r_6f72ff900102xqgi" class="SG_txtb"></span>

第一次用PYTHON，请有经验的朋友指点一下，谢谢~ ！

python

阅读 1.5k

1 个回答

得票最新

dodopy

2.4k1218

发布于
2018-04-03

获取文本内容使用.text或者.text()

撰写回答

你尚未登录，登录后可以

和开发者交流问题的细节
关注并接收问题和回答的更新提醒
参与内容的编辑和改进，让解决方法与时俱进

推荐问题

相似问题

找不到问题？创建新问题

python读取网页内容的问题

你尚未登录，登录后可以

字节的 trae AI IDE 不支持类似 vscode 的 ssh remote 远程开发怎么办？

DataCap 中验证码无法显示，后台出现 NullPointerException 错误?

发现深拷贝和浅拷贝效果一致：请问一下有什么区别呢？

如何实现一个深拷贝函数？

Python 成员变量在多个子类实例间共享，如何避免？

为什么 Qwen2.5-Omni-7B 官方教程都报错 Cannot import available module of Qwen2_5OmniModel in modelscope ？

Spark-TTS-0.5B 的 requirements.txt 在哪里？