用Python爬网页需要了解什么背景知识？

最近在学Python爬虫，写脚本进行模拟登录时，对很多名词一知半解，例如：
cookie, header, agent, proxy, timeout, HTTPError, URLError……
感觉这些词多少都听过，但也谈不上真的知道。所以跟着教程写东西时，稍微需要点变通就容易束手无策。

求问有什么书或者网络资源，是可以比较系统性的介绍这块内容的吗？

阅读 3.8k

2 个回答

得票最新

✓ 已被采纳

如果要视频教程推荐上慕课网看看，http://www.imooc.com/video/12622 这么课和配套课程你可以看看，书的话推荐图灵出品http://www.ituring.com.cn/boo...这本网络采集。
然后随时翻看wiki和google即可

HTML DOM结构，正则表达式， HTML解析库（Beautifulsoup4）,http请求库（urllib,requests）,一定的数据库基础

撰写回答

推荐问题

相似问题

找不到问题？创建新问题