如下验证码能被识别破解不
有没有什么思路可以借鉴
![]() | 1 iambic 2015-12-17 11:30:35 +08:00 最后一个是输入那五个字还是输入结果? |
![]() | 2 E2gCaBAT5I87sw1M 2015-12-17 11:40:01 +08:00 可以啊,人肉打码,一分钱一个,中国闲着没事干的人一堆一堆的。 |
4 Ricky123 OP |
![]() | 5 supman 2015-12-17 12:00:52 +08:00 via iPad 好牛掰的验证码啊 |
6 LuoLuoKaka 2015-12-17 12:02:49 +08:00 ![]() @winnie2012 可以把它做成游戏 |
![]() | 7 jacy 2015-12-17 12:13:25 +08:00 汉字的 ocr 技术很落后的 |
![]() | 8 wbsdty331 2015-12-17 12:34:30 +08:00 我记得 我以前搜狐帐号找回密码 就是这种 |
![]() | 9 ihciah 2015-12-17 15:51:56 +08:00 看起来字的位置大致固定,所以直接切开扔 CNN 即可。 训练集可以自己生成。 可以用 VGG19 做 finetune |
![]() | 10 ihciah 2015-12-17 15:52:58 +08:00 btw , 99%+肯定没有问题的 |
![]() | 12 Mutoo 2015-12-17 16:12:47 +08:00 人肉打码明码标价 http://www.jsdati.com/page/price |
![]() | 13 cevincheung 2015-12-17 16:16:00 +08:00 还是自己用拖拽验证吧…… 用非主流验证方式就行。 |
![]() | 14 kasp 2015-12-17 16:43:28 +08:00 企业信用信息公示系统就是用的这种 |
15 xierch 2015-12-17 20:03:58 +08:00 还都是成语.. 那这样组合就更少了,不是更容易.. |
![]() | 16 10iii 2015-12-17 21:03:15 +08:00 前两天从 V2 连过去的 企业信用信息公示系统+1 |
![]() | 18 tomb003 2015-12-18 02:19:00 +08:00 ![]() 这种验证码识别非常容易,做这个验证码的人一看就没研究过破解验证码,属于闭门造车自己想象出来的。 首先,每个字的颜色都不一样,和背景的颜色也不一样,直接就可以扣出所有的单字。 由于汉字是方块的,可以很容易得到扣出字的四边。 得到四边后就可以求得扭曲的角度,转成正常未扭曲过的单字。 由于每个字都是单色的,可以很容易转成黑白两色矩阵,减少比对需要的数据量。 剩下的就是找出这个验证码用的所有字体。 然后用二分查找法比对,非常快。 |
![]() | 21 mcone 2015-12-18 10:07:23 +08:00 前 2 个很简单,( 1 )字体颜色居然没变化,背景干扰可以很简单的通过 RGB 就给扔掉了,出了偶尔的粘连,字符切割基本不会出现任何问题;( 2 )没感觉错的话,这字没有经过扭曲吧,貌似就一个旋转?………切分好的话,完全是上世纪末就能解决的问题(实验室环境+工业界都有),即使是汉字,这是最标准的 OCR 。最重要的,( 3 ),居然是成语啊……他想不开么…………成语的话更简单了,找个词库,四个字第一候选认出来两个,认错 2 个,也能从其他候选里面纠正出来…… 第三个的话,得加上语义分析,就不是简单的 OCR 的操作了。不住要做这个,不多讲 |