最近要进行验证码识别,但是看到网上的文章对模型进行验证码识别,不理解其中的意思,求大神指教,谢谢
简单说 就是 机器看过各种各样的的字符,不关是你写的还是机器写的还是画家写的,然后你输入一个验证码,机器从验证码里,找到图形,通过贝叶斯找这个图形是某个字符的概率,哪个概率大,就是哪个。
使用神经网络的吧。
现在做法是,用CNN网络提取特征,训练一个分类器就OK了。特征
是什么?
非神经网络就是手工指定提取特征
的规则,比如数字1就是有一条竖线;
用神经网络就简单了,管它什么颜色 线性 角度 纹理,直接卷积卷积卷积自动抽取特征
吧。分类器呢,简单来讲,就是每个字都自动训练形成一个模板(怎么表示的,可能就是个512维向量,但其中某个数指代什么,不知道,基本无法解释,可以将网络中的一些高阶特征显示出来,和以前的颜色纹理等人定特征也蛮相似的),图片经过神经网络后也被抽象成512维的特征
向量,这张图片的特征向量和哪个字的模板最像 那就判别这个图片是那个字。训练过程就是一个反复强化的过程,最开始所有参数都随机生成,其中有些参数能让输入的图经过整套计算过程走到目标有些参数不能,能算到目标的哪些参数就被反复强化,老是算到其他目标的那些参数就被反复抑制,这样下去这些网络参数慢慢地就似乎认识教给它的东西了。
怎么说呢,你知道md5摘要吧,特征
就是摘要,只不过md5的任务目标和特征提取的任务目标不一致。但其实都是摘要。
1 回答3.2k 阅读
2 回答1.5k 阅读
3 回答703 阅读
587 阅读
模式识别吧?