python3用urllib爬网页，为什么得到的html只有上半部分？

python版本3.7.0
在使用urllib爬虫获取网页html代码时，编码时报错，忽略掉错误。

html = data.decode(charset,errors='ignore')

得到的html只有上半部分。

而网页本应该已</html>结尾的。

就是说丢失了一部分。
请问各位大神这是什么情况？
网上都搜不到结果。难道就我一个人遇到吗？
话说python写爬虫确实快，但我刚开始都踩了好几个坑了。

阅读 2.5k

2 个回答

得票最新

✓ 已被采纳

问题解决啦，是vs code的问题，换了调试环境就好了。看来vs code还是不能做开发环境用。

是不是爬的内容太大了。vscode默认只显示一定大小内的

撰写回答

推荐问题

相似问题

找不到问题？创建新问题