VoidKing - SegmentFault 思否

Python抓取百度百科数据

2017-02-03

阅读 7 分钟

7.6k

确定目标：确定抓取哪个网站的哪些页面的哪部分数据。本实例抓取百度百科python词条页面以及python相关词条页面的标题和简介。分析目标：分析要抓取的url的格式，限定抓取范围。分析要抓取的数据的格式，本实例中就要分析标题和简介这两个数据所在的标签的格式。分析要抓取的页面编码的格式，在网页解析器部分，要指定网...

Python抓取百度百科数据

Python爬虫基础