用Python爬网页需要了解什么背景知识?

最近在学Python爬虫,写脚本进行模拟登录时,对很多名词一知半解,例如:
cookie, header, agent, proxy, timeout, HTTPError, URLError……
感觉这些词多少都听过,但也谈不上真的知道。所以跟着教程写东西时,稍微需要点变通就容易束手无策。

求问有什么书或者网络资源,是可以比较系统性的介绍这块内容的吗?

阅读 3.8k
2 个回答

HTML DOM结构,正则表达式, HTML解析库(Beautifulsoup4),http请求库(urllib,requests),一定的数据库基础

撰写回答
你尚未登录,登录后可以
  • 和开发者交流问题的细节
  • 关注并接收问题和回答的更新提醒
  • 参与内容的编辑和改进,让解决方法与时俱进
推荐问题