现在哪个多模态视觉ai大模型可以用于 ocr 识别反爬虫验证码?

爬虫场景,用于过各种各样的图片验证码

有谁测试过哪个 多模态视觉ai大模型 可以吗?

我发现常见的那些,好像都没有针对验证码做过训练,是为了规避法律风险吗?

阅读 1k
2 个回答

不用大模型都能识别。
问题是,你干啥。识别那种数字、文字、中英文验证码,然后呢?那种滑动验证码LLM也搞不定啊。

破解滑动验证码自己学transformer

你可以试试,让模型识别形状 + 符合形状的凹槽,然后给出绝对位置

后面的滑动你就要自己模拟鼠标去移动

不过仅仅是识别这种,不需要大模型,普通的图像识别就可以

撰写回答
你尚未登录,登录后可以
  • 和开发者交流问题的细节
  • 关注并接收问题和回答的更新提醒
  • 参与内容的编辑和改进,让解决方法与时俱进
推荐问题