使用python的urllib获取的网页源代码和在浏览器上查看的源代码不一样？

Question

使用python的urllib获取的网页源代码和在浏览器上查看的源代码不一样？

发布于
2016-03-22

我发现使用python的urllib得到的网页源代码和直接在网页上查看的网页源代码有一些差别，直接查看源代码的方式看到的更加完整一些，例如某个href="http://www.baidu.com/ss/sd/12.jpg",但是通过urllib得到的源代码中只有：href="ss/12.jpg"或者干脆就是12.jpg，对此表示非常疑惑，哪位大神能够解释一下这是什么原因造成的？（urllib里面基本按照浏览器请求的头部来添加的头部字段）谢谢！

python html

html5

阅读 5.6k

1 个回答

得票最新

hsfzxjy

22k51941

发布于
2016-03-22

✓ 已被采纳

同域下请求资源可省略协议甚至域名，因此所谓“不完整”的url都是合法的。

至于你看到的“完整”的url，都是浏览器为了更好的调试体验而加工过的。

撰写回答