这种验证码能被识别破解不? - V2EX
V2EX = way to explore
V2EX 是一个关于分享和探索的地方
现在注册
已注册用户请  登录
Ricky123
V2EX    问与答

这种验证码能被识别破解不?

  •  
  •   Ricky123 2015-12-17 11:13:09 +08:00 4907 次点击
    这是一个创建于 3588 天前的主题,其中的信息可能已经有所发展或是发生改变。

    如下验证码能被识别破解不
    有没有什么思路可以借鉴


    1

    2

    3

    26 条回复    2015-12-19 16:05:55 +08:00
    iambic
        1
    iambic  
       2015-12-17 11:30:35 +08:00
    最后一个是输入那五个字还是输入结果?
    E2gCaBAT5I87sw1M
        2
    E2gCaBAT5I87sw1M  
       2015-12-17 11:40:01 +08:00
    可以啊,人肉打码,一分钱一个,中国闲着没事干的人一堆一堆的。
    Ricky123
        3
    Ricky123  
    OP
       2015-12-17 11:40:34 +08:00
    @iambic 最后一个是输入结果
    Ricky123
        4
    Ricky123  
    OP
       2015-12-17 11:41:28 +08:00
    @winnie2012

    ...
    对于这种有什么机器的方法思路么
    supman
        5
    supman  
       2015-12-17 12:00:52 +08:00 via iPad
    好牛掰的验证码啊
    LuoLuoKaka
        6
    LuoLuoKaka  
       2015-12-17 12:02:49 +08:00   1
    @winnie2012 可以把它做成游戏
    jacy
        7
    jacy  
       2015-12-17 12:13:25 +08:00
    汉字的 ocr 技术很落后的
    wbsdty331
        8
    wbsdty331  
       2015-12-17 12:34:30 +08:00
    我记得 我以前搜狐帐号找回密码 就是这种
    ihciah
        9
    ihciah  
       2015-12-17 15:51:56 +08:00
    看起来字的位置大致固定,所以直接切开扔 CNN 即可。
    训练集可以自己生成。
    可以用 VGG19 做 finetune
    ihciah
        10
    ihciah  
       2015-12-17 15:52:58 +08:00
    btw , 99%+肯定没有问题的
    47jm9ozp
        11
    47jm9ozp  
       2015-12-17 16:07:46 +08:00
    @ihciah ……我去实验一下……
    Mutoo
        12
    Mutoo  
       2015-12-17 16:12:47 +08:00
    人肉打码明码标价 http://www.jsdati.com/page/price
    cevincheung
        13
    cevincheung  
       2015-12-17 16:16:00 +08:00
    还是自己用拖拽验证吧…… 用非主流验证方式就行。
    kasp
        14
    kasp  
       2015-12-17 16:43:28 +08:00
    企业信用信息公示系统就是用的这种
    xierch
        15
    xierch  
       2015-12-17 20:03:58 +08:00
    还都是成语.. 那这样组合就更少了,不是更容易..
    10iii
        16
    10iii  
       2015-12-17 21:03:15 +08:00
    前两天从 V2 连过去的 企业信用信息公示系统+1
    TaMud
        17
    TaMud  
       2015-12-18 00:59:06 +08:00
    @ihciah 有作品可供演示不?
    tomb003
        18
    tomb003  
       2015-12-18 02:19:00 +08:00   2
    这种验证码识别非常容易,做这个验证码的人一看就没研究过破解验证码,属于闭门造车自己想象出来的。
    首先,每个字的颜色都不一样,和背景的颜色也不一样,直接就可以扣出所有的单字。
    由于汉字是方块的,可以很容易得到扣出字的四边。
    得到四边后就可以求得扭曲的角度,转成正常未扭曲过的单字。
    由于每个字都是单色的,可以很容易转成黑白两色矩阵,减少比对需要的数据量。
    剩下的就是找出这个验证码用的所有字体。
    然后用二分查找法比对,非常快。
    wxg4net
        19
    wxg4net  
       2015-12-18 08:05:18 +08:00
    @tomb003 真棒
    Ricky123
        20
    Ricky123  
    OP
       2015-12-18 08:32:08 +08:00
    @kasp
    是的
    在研究这个...
    mcone
        21
    mcone  
       2015-12-18 10:07:23 +08:00
    前 2 个很简单,( 1 )字体颜色居然没变化,背景干扰可以很简单的通过 RGB 就给扔掉了,出了偶尔的粘连,字符切割基本不会出现任何问题;( 2 )没感觉错的话,这字没有经过扭曲吧,貌似就一个旋转?………切分好的话,完全是上世纪末就能解决的问题(实验室环境+工业界都有),即使是汉字,这是最标准的 OCR 。最重要的,( 3 ),居然是成语啊……他想不开么…………成语的话更简单了,找个词库,四个字第一候选认出来两个,认错 2 个,也能从其他候选里面纠正出来……

    第三个的话,得加上语义分析,就不是简单的 OCR 的操作了。不住要做这个,不多讲
    TaMud
        22
    TaMud  
       2015-12-18 11:10:58 +08:00
    @mcone 有可供演示的作品不?
    TaMud
        23
    TaMud  
       2015-12-18 11:14:24 +08:00
    @tomb003 有可供演示的作品不
    ihciah
        24
    ihciah  
       2015-12-18 17:03:56 +08:00
    @TaMud 上次电子科大办了一个验证码识别大赛我们拿了第二名,几种验证码有的是中文的,有的是英文的,我们全是用深度学习做的。传统 OCR 搞搞简单的还行,复杂一点就不好说了。
    TaMud
        25
    TaMud  
       2015-12-19 15:02:40 +08:00
    @ihciah 有演示不?要不我给你些验证码,给个结果我,我只要看到演示结果就行了,有报酬
    ihciah
        26
    ihciah  
       2015-12-19 16:05:55 +08:00
    @TaMud 私戳我 id@gmail
    关于     帮助文档     自助推广系统     博客     API     FAQ     Solana     5490 人在线   最高记录 6679       Select Language
    创意工作者们的社区
    World is powered by solitude
    VERSION: 3.9.8.5 27ms UTC 08:34 PVG 16:34 LAX 01:34 JFK 04:34
    Do have faith in what you're doing.
    ubao snddm index pchome yahoo rakuten mypaper meadowduck bidyahoo youbao zxmzxm asda bnvcg cvbfg dfscv mmhjk xxddc yybgb zznbn ccubao uaitu acv GXCV ET GDG YH FG BCVB FJFH CBRE CBC GDG ET54 WRWR RWER WREW WRWER RWER SDG EW SF DSFSF fbbs ubao fhd dfg ewr dg df ewwr ewwr et ruyut utut dfg fgd gdfgt etg dfgt dfgd ert4 gd fgg wr 235 wer3 we vsdf sdf gdf ert xcv sdf rwer hfd dfg cvb rwf afb dfh jgh bmn lgh rty gfds cxv xcv xcs vdas fdf fgd cv sdf tert sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf shasha9178 shasha9178 shasha9178 shasha9178 shasha9178 liflif2 liflif2 liflif2 liflif2 liflif2 liblib3 liblib3 liblib3 liblib3 liblib3 zhazha444 zhazha444 zhazha444 zhazha444 zhazha444 dende5 dende denden denden2 denden21 fenfen9 fenf619 fen619 fenfe9 fe619 sdf sdf sdf sdf sdf zhazh90 zhazh0 zhaa50 zha90 zh590 zho zhoz zhozh zhozho zhozho2 lislis lls95 lili95 lils5 liss9 sdf0ty987 sdft876 sdft9876 sdf09876 sd0t9876 sdf0ty98 sdf0976 sdf0ty986 sdf0ty96 sdf0t76 sdf0876 df0ty98 sf0t876 sd0ty76 sdy76 sdf76 sdf0t76 sdf0ty9 sdf0ty98 sdf0ty987 sdf0ty98 sdf6676 sdf876 sd876 sd876 sdf6 sdf6 sdf9876 sdf0t sdf06 sdf0ty9776 sdf0ty9776 sdf0ty76 sdf8876 sdf0t sd6 sdf06 s688876 sd688 sdf86