![]() | 1 jugelizi 2020-01-30 14:03:26 +08:00 ![]() 研表究明,汉字序顺并不定一影阅响读 |
2 xml123 2020-01-30 14:04:37 +08:00 那不还是验证码的技术吗 |
![]() | 6 jdhao 2020-01-30 14:17:33 +08:00 via Android ![]() ocr 只是把文字位置检测出来,然后识别文字,对于规则排布的文本估计也可能提取意思。知道这个原理,你就能做出反 ocr 程序,一个思路,你把汉字排布弄乱一点,不要简单横排或者竖排(譬如波浪形状,或者更加复杂的形状),另外再加一些北京噪声,图片模糊效果,就可以防住很多 ocr 了。 |
7 Co1a 2020-01-30 14:23:03 +08:00 via iPhone Leetcode 猪年那道题算是最简单的加密吧…… |
8 OceanSea 2020-01-30 14:27:44 +08:00 ![]() 将汉字在图片上随机排布、然后用一条线连起来表明阅读顺序 |
![]() | 9 yinanc 2020-01-30 14:44:05 +08:00 via iPhone 众所周知,验证码就是用来反 ocr 的 |
10 kknd22 2020-01-30 14:51:54 +08:00 ![]() 方正启功字体+缩小行间距,有奇效 |
11 kknd22 2020-01-30 14:56:54 +08:00 ![]() 类似 6 楼的字,字体不加修改,行距改为 0.5,效果如下: OCr 只是把又子位置检测出米,然后识别又子,对十郑则排币的又他订也可能疾取息思。知追这个尿性,你就能倾出 oCr 样序,一个思语,你把义子“排作弄机一点,个妥简单使排首竖排(管如波浪形状,者更川复杂的形状),另外再加一些北只栗户,图片模糊双果,就可以防任很多 Qr 了。 |
12 kknd22 2020-01-30 14:58:14 +08:00 肉眼识别有略微障碍,但基本不影响阅读 这就是好多网上防爬取小说的思路,当然,他还得增加文字转截图 |
![]() | 13 shilyx 2020-01-30 15:20:21 +08:00 base64 或者自制码表的 base64 |
14 yohanechan OP @jugelizi 哈哈,这也是个办法,但汉字最多移动 2~3 格,动多了就难读了 |
15 yohanechan OP @kknd22 这只是替换为外形相似的文字,实现起来还得有庞大的数据库支持 |
16 panda1001 2020-01-30 15:27:12 +08:00 via Android 用过 abbyy 的一些 ocr 就有经验了,比如单个文字在◇符号中间,就是文字的边缘加上干扰,虽然没有亲测 tx 的在线 ocr,但也提供这个思路 |
17 superrichman 2020-01-30 15:35:54 +08:00 via iPhone 使用小众点的字体再加干扰线应该可以。 另外,我记得有那种要从某个比较低的角度看才能看出文字的图。原理就是把文字垂直拉伸的很长,这种变形的厉害的文字应该也不会被识别。 |
18 yohanechan OP 谢谢大家的帮助,我找到了基本符合需求的产品 https://github.com/yuzu233/anti-ocr |
![]() | 19 Buges 2020-01-30 16:20:20 +08:00 via Android ![]() 这边建议直接用 GPG 呢 |
20 kknd22 2020-01-30 16:24:38 +08:00 @yohanechan 卧槽,这个效果真狠啊。。。 |
![]() | 21 suotm 2020-01-30 16:29:46 +08:00 加干扰线或者颠倒文字方向 |
![]() | 22 autogen 2020-01-30 16:45:26 +08:00 你需要的是,全自动区分计算机和人类的图灵测试。。。。 有以下方式: 填空:1 + 2 = __ ---- 填空:我们的名称是___ ---- 填空:出门要__口罩 ---- 选择题:勾选以下图片中所有的啤酒 ---- 操作题:把斜的图片旋转正 ---- 操作题:拖动滑块完成验证 |
![]() | 23 vocaloid 2020-01-30 17:01:49 +08:00 @yohanechan #18 他这个测试网站似乎无法打开 |
![]() | 24 gladuo 2020-01-30 17:01:55 +08:00 @yohanechan 划线确实 nb |
![]() | 26 jdhao 2020-01-30 17:08:18 +08:00 via Android @yohanechan 他这个似乎只是把已有的图片干扰,如果你想传递文字信息,还是不行 |
27 yohanechan OP @autogen 猫坐在毯子上,因为它很温暖。____很温暖? |
28 yohanechan OP |
![]() | 29 tabris17 2020-01-30 19:17:48 +08:00 ![]() 有个办法可以躲过通用 OCR 程序。 原理就是利用 GIF 动态图片,两帧来回闪现,把每个字各切一半放在不同的两帧里 如果是针对性的 OCR 就没办法了 |
30 wpblank 2020-01-30 19:18:21 +08:00 类这子话以? 似样说可吗 |
![]() | 31 akira 2020-01-30 20:17:10 +08:00 人肉 ocr |
32 tfdetang 2020-01-30 20:18:34 +08:00 @yohanechan 其实理论上划线并不能规避把。我们训练 ocr 识别模型的时候都会加入干扰线样本进行对抗 |
34 zlowly 2020-01-31 00:48:20 +08:00 根据以往项目的经验(使用用 ABBYY 对含表格的扫描打印件进行 OCR),表格中的文字 ocr 识别率是大幅下降的,即使是表格附近的文字也有影响。所以可以尝试叠加一层表格上去试试看,对人眼应该影响不大的,但 ocr 出来肯定就是极多错别字。 |
35 2kCS5c0b0ITXE5k2 2020-01-31 00:58:40 +08:00 近义字 异体字 或者单纯外号. 甚至外号的异体字和近义字 都可以吧 |