编写爬虫的一些感想(就是高兴)

2016-02-18
阅读 4 分钟
9.4k
今天,根据网页的结构,尝试了下如何抓取煎蛋首页上的文章。目标很简单: 根据首页上面的文章链接,载入文章,而后将文章的标题和正文(不带图片)抓取下来。 抓取首页上面文章的链接,标题,作者和所属标签。 按标题将文章写入一个.txt格式的文件 将首页上抓取的内容整合起来,制作成格式如下的Markdown简介。 首页的简...