SF
好玩儿的东西
好玩儿的东西
注册登录
关注博客
注册登录
主页
关于
RSS
验证码破解技术四部曲之使用卷积神经网络(四)
叁公子_KCN
2016-09-24
阅读 6 分钟
13.6k
本节使用的神经网络是国外学者Yann LeCun的LeNet5,该神经网络以32x32的图片作为输入,对于字符的变形、旋转、干扰线等扭曲都可以很好的识别,可以实现以下效果。
验证码破解技术四部曲之使用K近邻算法(三)
叁公子_KCN
2016-09-23
阅读 5 分钟
11.3k
在上一节中,我们使用了google的开源OCR库来对字符进行识别,这一节以及下一节我们将要使用机器学习算法来识别验证码。本节的代码都在[链接]可以找到。
验证码破解技术四部曲之使用Tesseract(二)
叁公子_KCN
2016-09-22
阅读 2 分钟
7.4k
代码下载 本节的代码可以通过此处进行下载。 图像直方图 首先看验证码的样子, 可以看到这几个验证码最大的特点就是字母比较深,而周围的背景很浅,把图像转换成黑白颜色,可以显示的更加的明显。 {代码...} 可以看到所有背景的灰度值,都会小于字母的灰度值,为了让tesseract更准确的识别,可以把图像进行二值化,也就...
验证码破解技术四部曲之环境搭建篇(一)
叁公子_KCN
2016-06-28
阅读 2 分钟
8.1k
转眼就变成大四狗了,大学期间做的比较深入的技术是爬虫,但是爬虫也有很多高级的技术没有涉及,比如说验证码的破解便是其中之一,再加上我对其非常感兴趣,于是乎,开始苦学图像处理、学习机器学习,验证码破解也有了些眉头。
express+sequelize写一个简单的留言板
叁公子_KCN
2016-02-10
阅读 5 分钟
10k
为了教女友node中数据库的使用,花了几个小时看了一下sequelize这个orm框架,然后写了一个简单的留言板,可以实现发表留言,删除留言,修改留言.(注:我本身不是学js的,node也就断断续续学了几天,半吊子,有不对的或者写的不好的地方希望指出.)NodeJs版本:0.12.4(有点老了。。。)系统:Ubuntu 14.04(系统貌似都差不多)
一个淘宝文胸的评论的爬虫。
叁公子_KCN
2016-02-02
阅读 2 分钟
6k
上个月用 go 语言写的,超低性能的服务器,爬了一个晚上,两百多万条评论。当时简单的分析了一下,后来就去忙考试了。最近又搞了搞,不过发现目前淘宝 ip 禁的比较严,已经不能用了,本来想发代码的,现在就不发了。目前正在尝试用代理 ip 解决。