现在哪个多模态视觉ai大模型可以用于 ocr 识别反爬虫验证码?

爬虫场景,用于过各种各样的图片验证码

有谁测试过哪个 多模态视觉ai大模型 可以吗?

我发现常见的那些,好像都没有针对验证码做过训练,是为了规避法律风险吗?

阅读 1.1k
2 个回答

不用大模型都能识别。
问题是,你干啥。识别那种数字、文字、中英文验证码,然后呢?那种滑动验证码LLM也搞不定啊。

破解滑动验证码自己学transformer

你可以试试,让模型识别形状 + 符合形状的凹槽,然后给出绝对位置

后面的滑动你就要自己模拟鼠标去移动

不过仅仅是识别这种,不需要大模型,普通的图像识别就可以

推荐问题