大虫 - SegmentFault 思否

基于 Python 的 Scrapy 爬虫入门：图片处理

2017-11-29

阅读 3 分钟

4.9k

上篇文章中讲解了如何从网站页面抓取所需要的数据，很幸运范例中所需的数据是通过 Ajax 请求返回的 JSON 结构化数据，处理起来很简单，图片内容也只取了一个链接，对于我最初的目标“把这些图集添加到自己的博客站点中”这已经够了，说白了就是“盗链”嘛，如果有一天网站做了防盗链措施，那这些抄来的图集就都作废了，保险...

基于 Python 的 Scrapy 爬虫入门：页面提取

2017-11-28

阅读 8 分钟

11.9k

打开图虫网，顶部菜单“发现” “标签”里面是对各种图片的分类，点击一个标签，比如“美女”，网页的链接为：[链接]，我们以此作为爬虫入口，分析一下该页面：

基于 Python 的 Scrapy 爬虫入门：环境搭建

2017-11-17

阅读 3 分钟

6.6k

作为一个全栈工程师（:-) HoHo），前端后台都懂点是必须的，但是Python 很菜，Scrapy 更菜，没错，这就是 Full Stack Developer 的特点，什么都懂点，什么都不精，我们的特点就是上手快，忘得也很快，不过配合强大的搜索引擎，写些小东西出来是不成问题的！

jQuery 效率提升建议

2017-11-07

阅读 5 分钟

5.6k

jQuery简洁通用的方法集把编码者从繁重的工作中解脱出来，也拉低了进入javascript的门槛，初学者对浏览器兼容性一无所知的情况下，几行代码就可以写出超炫的特效。网上有一篇文章转载比较泛滥，已经不知道原文作者了，里面针对jQuery效率提升建议非常科学，现在重新组织里面的内容并转载。