有了 iText:你截图,腾讯、Google OCR 帮你识别文字 [送码] - V2EX
V2EX = way to explore
V2EX 是一个关于分享和探索的地方
现在注册
已注册用户请  登录
爱意满满的作品展示区。
quietjosen
V2EX    分享创造

有了 iText:你截图,腾讯、Google OCR 帮你识别文字 [送码]

  •  1
     
  •  
    quietjosen
    atjason 2017-11-30 07:32:21 +08:00 17202 次点击
    这是一个创建于 2873 天前的主题,其中的信息可能已经有所发展或是发生改变。

    比如,在看类似上面的扫描版 PDF 时,想要复制其中的文字,怎么办?手打?太累。试试我新开发的工具 iText 吧。

    iText 是 macOS 平台的 OCR 工具,自带截图功能,选择屏幕任意区域,即可识别其中的文字,又爽又酷。

    识别后的文字已经复制到系统剪贴板,直接粘贴即可。

    配合 1 快捷键,使用体验更佳。当然,你也可以选择图片文件,或者将图片拖拽至 iText 的菜单栏图标进行识别。

    文字识别精准

    你有没有这种印象:OCR 识别出来的文字有很多问题,还不如自己打字来得快。可见,识别的准确性非常重要,也是我非常在意的一点。

    2.1. 腾讯、Google 双引擎

    首先,我排除了离线的识别库,因为离线注定了这些库的识别能力是死的,不会自己增强。接下来,在一票在线 OCR 服务中,我对比了百度、腾讯、微软、Google 等大厂的产品,最后选择了国内使用腾讯、国外使用 Google 的组合。判断依据是什么?少量测试 + 主观倾向,比如不测我就觉得 Google 比微软牛。

    那么,到底识别准不准呢?这么说吧:

    • 对于一般的自然语言,比如书中的一段话、新闻稿,识别效果是惊人的准确,甚至可以达到 100%
    • 对于排版复杂、尤其有特殊字符的文字,比如程序代码、选择题,识别效果就不太理想,需要手动对识别后的结果进行修正
      • 比如,单纯地给一个竖线,机器是无法区分到底是小写的 l、还是大写的 I (顺便问一下,你看出二者的区别了吗?);与之相对,机器是需要根据上下文进行判断和优化的。而像程序代码这种非自然语言,机器目前是很难进行语义识别的

    到底准不准?你不妨一试。

    2.2. 独创算法,进一步优化识别结果

    OCR 服务还有一些欠缺,iText 针对性地做了这些优化:

    • 自动识别段落
    • 中文环境使用全角标点符号
    • 中文与英文字母、数字间增加空格
    • 删除中文字符间、英文字符与标点符号间的多余空格
    • 英文首字母大写

    如果你发现识别不好的地方,欢迎把图发给我,我会相应地优化算法,毕竟算法是需要数据喂养的,先谢。

    2.2. 预览原图,方便校对

    在目前 OCR 技术不能始终达到 100% 的情况下,预览原图、并进行修正,还是有必要的。在 iText 中,你可以这样:

    • 将识别后的窗口拖到图片附近
    • 调用 iText 识别结果的 双栏模式:左侧展示图片、右侧展示识别后的文字

    这样,就可以很方便地对照原图进行手动优化识别后的文字。

    3. 下载与付费

    其实,很多场景都会用到 iText,比如 识别快递单上的号码、图片中的联系人信息、需要登录才能复制的网页 等等,欢迎下载 iText 试试。

    每月可免费识别 20 次,订阅 iText 高级版即可无限次识别。首发期间,高级版限时 6 折优惠:¥ 3/月、¥ 30/年。关于收费模式,我很是纠结了一番。如果你准备吐槽,请先看下这篇文章再次纠结付费模式,这次是 iText

    V 友专属福利:iText Pro 一年期兑换码:

    JAY9T73KR4TP TFA6KWKTRW4E KY639HYMWMPH T6LRJ77HR7JT HFJMKT39J6F7 

    手慢无;兑换后,最好在这里留言说明哪个已经用了,节约其他 V 友时间。


    如果你觉得 iText 还不错,还请帮忙 在 App Store 评论;如果你觉得 iText 还可以改进,欢迎:

    82 条回复    2017-12-08 08:44:38 +08:00
    liz2nku
        1
    liz2nku  
       2017-11-30 07:35:35 +08:00 via iPhone
    好顶赞,感觉近期用不上所以码就不领了,留给后来的同学
    quietjosen
        2
    quietjosen  
    OP
       2017-11-30 07:43:10 +08:00
    @liz2nku 大气
    chenxu
        3
    chenxu  
       2017-11-30 07:50:11 +08:00 via Android
    路过帮顶,这软件看着很牛逼,不过我暂时用不上。兑换码就留给楼下吧。
    Jobin0528
        4
    Jobin0528  
       2017-11-30 07:57:55 +08:00
    感谢分享!
    HFJMKT39J6F7
    已用。
    wweih
        5
    wweih  
       2017-11-30 08:01:18 +08:00 via Android
    没有 window 版本
    dickmrbean
        6
    dickmrbean  
       2017-11-30 08:02:34 +08:00
    T6LRJ77HR7JT 已用,感谢!
    Jobin0528
        7
    Jobin0528  
       2017-11-30 08:09:26 +08:00
    为什么美区价格依然 0.99/m;9.99/y.
    zhang1215
        8
    zhang1215  
       2017-11-30 08:17:16 +08:00
    这款软件看起来很棒,留给急需的同学
    7gong
        9
    7gong  
       2017-11-30 08:18:45 +08:00 via iPhone
    码不领了,帮赞
    aksoft
        10
    aksoft  
       2017-11-30 08:25:29 +08:00   1
    不支持 windows 就是耍流氓。。。
    xingwing
        11
    xingwing  
       2017-11-30 08:26:35 +08:00
    JAY9T73KR4TP,已用,感谢
    miniers
        12
    miniers  
       2017-11-30 08:30:50 +08:00
    TFA6KWKTRW4E 已用。感谢楼主
    quietjosen
        13
    quietjosen  
    OP
       2017-11-30 08:30:52 +08:00
    @Jobin0528 咦,奇怪,我 28 小时前就在 iTunes 后台改过价格了,现在还没更新?可能是时差问题,美国时间还没到 30 号,可以再等等。
    dongming83
        14
    dongming83  
       2017-11-30 08:31:04 +08:00
    JAY9T73KR4TP 已用,谢谢
    xingwing
        15
    xingwing  
       2017-11-30 08:41:14 +08:00
    naiba
        16
    naiba  
       2017-11-30 08:42:31 +08:00 via Android
    真的是优化了算法吗,还是对 ocr 接口返回的结果简单的进行了中文版式优化。要我都不敢把这种小儿科的东西发出来
    caidaoli
        17
    caidaoli  
       2017-11-30 08:50:16 +08:00
    试了一下确实很不错
    quietjosen
        18
    quietjosen  
    OP
       2017-11-30 08:51:51 +08:00
    @naiba 没事,你发出来吧。
    quietjosen
        19
    quietjosen  
    OP
       2017-11-30 08:52:16 +08:00
    @caidaoli 谢谢肯定
    douglas1997
        20
    douglas1997  
       2017-11-30 09:07:06 +08:00
    已买,感觉是不错的软件。谢谢作者。价格已经很便宜了,给你点赞。希望开发出更好的工具。
    记得好像把 iPic, iPaste 都买了。
    quietjosen
        21
    quietjosen  
    OP
       2017-11-30 09:18:40 +08:00
    @douglas1997 谢谢肯定,我一直在坚持,iText 已经是第 7 款 macOS App 了
    zjia8765
        22
    zjia8765  
       2017-11-30 09:24:27 +08:00
    试用了下,不错,赞一个
    quietjosen
        23
    quietjosen  
    OP
       2017-11-30 09:26:24 +08:00
    @zjia8765 谢谢,努力得到肯定,开心
    WhiteSJ
        24
    WhiteSJ  
       2017-11-30 09:31:03 +08:00
    很不错, 赞一个
    newbieo0O
        25
    newbieo0O  
       2017-11-30 09:31:59 +08:00
    挺方便的。
    seasstyle
        26
    seasstyle  
       2017-11-30 09:33:01 +08:00 via iPhone
    谷歌大法好!
    上次用谷歌的翻译 api 翻译了一个 5400 行 9 列的表格,那速度和质量灰常好!
    January
        27
    January  
       2017-11-30 09:46:39 +08:00
    赞,试用一段时间看看。
    isCyan
        28
    isCyan  
       2017-11-30 09:53:13 +08:00 via Android
    能对比下 Google 和微软的识别效果吗。微软必应的翻译 API 质量是显然高于谷歌的。不知道 OCR 是否也是如此。
    rzti483NAJ66l669
        29
    rzti483NAJ66l669  
       2017-11-30 10:08:10 +08:00 via iPhone
    建议是可以采用多种付费方式,
    一天用 100 次,包月不亏,
    装上去留着备用,一个月都不见得能用几次。
    chinajik
        30
    chinajik  
       2017-11-30 10:13:23 +08:00
    KY639HYMWMPH 已用
    quietjosen
        31
    quietjosen  
    OP
       2017-11-30 10:17:30 +08:00
    quietjosen
        32
    quietjosen  
    OP
       2017-11-30 10:17:49 +08:00
    @WhiteSJ
    @newbieo0O
    @January 谢谢支持。
    joe1213
        33
    joe1213  
       2017-11-30 10:19:01 +08:00
    iText 跟那个处理 pdf 的软件不是重名了吗
    quietjosen
        34
    quietjosen  
    OP
       2017-11-30 10:19:51 +08:00
    @isCyan 并不能。因为如果提供客观公正的结论,要做大量的测试,我做不到,不能随便下结论;并且,云服务是在不断变化的。

    不过,你提供一张具体的图,我是可以给出二者的识别结果的。
    LarryDev
        35
    LarryDev  
       2017-11-30 10:20:17 +08:00
    已设为开机启动
    quietjosen
        36
    quietjosen  
    OP
       2017-11-30 10:20:32 +08:00
    @humorce 「装上去留着备用,一个月都不见得能用几次。」 iText 默认每月可免费识别 20 次,像你说的够用了。
    quietjosen
        37
    quietjosen  
    OP
       2017-11-30 10:21:12 +08:00
    @joe1213 不管,我就喜欢 主要是跟我 i 系列的名字一致。要起个好的、又全球唯一的名字,几乎不可能。
    quietjosen
        38
    quietjosen  
    OP
       2017-11-30 10:21:30 +08:00
    @LarryDev 最实在的支持
    rexer
        39
    rexer  
       2017-11-30 10:24:19 +08:00 via Android
    想入手 可惜没有 mac
    newbieo0O
        40
    newbieo0O  
       2017-11-30 11:12:07 +08:00
    wri t e

    wh i 1 e

    a, b=0,1

    -----------

    逗号会识别成中文全角的情况
    quietjosen
        41
    quietjosen  
    OP
       2017-11-30 11:37:46 +08:00
    @newbieo0O 你是尝试识别程序代码吗?文中有提,这种情况识别不好。对于自然语言比较好些。
    linKnowEasy
        42
    linKnowEasy  
       2017-11-30 11:48:16 +08:00
    支持楼主, 现在 Mac 开发人员感觉还是很少啊
    quietjosen
        43
    quietjosen  
    OP
       2017-11-30 12:00:55 +08:00
    @linKnowEasy 跟 iOS 没法比,目测 1% 不到。
    sangmong
        44
    sangmong  
       2017-11-30 13:31:05 +08:00
    有没有 iOS 版
    quietjosen
        45
    quietjosen  
    OP
       2017-11-30 13:37:18 +08:00
    @sangmong 没; iOS 其实有很多选择,比如「白描」
    ethusdt
        46
    ethusdt  
       2017-11-30 13:43:39 +08:00
    老哥 稳
    suliuyes
        47
    suliuyes  
       2017-11-30 14:26:19 +08:00
    支持独立开发者。话说,老哥你除了 v 站,在别的地方有推你的应用吗?只靠 v 站网友应该养不活自己吧?
    quietjosen
        48
    quietjosen  
    OP
       2017-11-30 14:39:50 +08:00
    @suliuyes 微博、知乎等等吧,你觉得还在哪推荐比较好呢?
    ayconanw
        49
    ayconanw  
       2017-11-30 16:09:23 +08:00
    什么时候出 windows 版
    tianyuhong
        50
    tianyuhong  
       2017-11-30 16:29:56 +08:00
    订阅支持下你
    quietjosen
        51
    quietjosen  
    OP
       2017-11-30 16:39:01 +08:00
    @ayconanw 抱歉,短期无计划。
    hester
        52
    hester  
       2017-11-30 16:39:07 +08:00
    iText 名字也忒不符了。。。还不如叫 iOCR。。。
    既然使用了第三方库,很好奇这些库的授权协议是什么。。。
    在线上传的话,隐私性会很有问题。。。
    都是公司文件截图、发票截图之类的。。。基本上不敢这么用。
    另外,我个人觉得一个 chrome extension 就能搞定的事情,非要弄个订阅。。。这种小型工具就应该一次性付费。。。

    最后的最后,兑换码也忒抠了,虽然我不用,但是你可以看看其它 在这里发布 app 的作者,他们的兑换码有多少个。。。
    quietjosen
        53
    quietjosen  
    OP
       2017-11-30 16:39:18 +08:00
    @tianyuhong 谢谢老铁
    quietjosen
        54
    quietjosen  
    OP
       2017-11-30 16:51:33 +08:00
    @hester 名字偏好各有所好。隐私协议可见于腾讯和 Google 的声明。关于付费,请参见文末的介绍及链接。期待你的
    Chrome Extension。对,我很抠。
    hanzichi
        55
    hanzichi  
       2017-11-30 17:44:42 +08:00
    顶一个,用过楼主的 iPic,很好用

    能否借地问楼主一个问题,macOS 开发零基础,我想做个工具自己用,具体只有两个需求(都是 BetterTouchTool 里的功能)

    1. 三个手指 click trackpads,触发 win+w (也就是关闭)
    2. 两个手指,一个手指按住,另一个轻点,触发另一个快捷键

    先谢过了
    iyaozhen
        56
    iyaozhen  
       2017-11-30 17:48:41 +08:00 via Android   2
    @hester 楼主调用识别接口也是要付费的。

    公司业务肯定不方便使用,楼主这个主要也是 to C 的吧
    linxijun
        57
    linxijun  
       2017-11-30 18:16:42 +08:00
    @quietjosen 兑换码用完了??
    quietjosen
        58
    quietjosen  
    OP
       2017-11-30 18:27:16 +08:00
    @hanzichi 我没有这部分直接的开发经验哎,看看 NSEvent 相关的介绍吧。
    quietjosen
        59
    quietjosen  
    OP
       2017-11-30 18:28:15 +08:00
    @iyaozhen 感谢,你说了公道话。
    quietjosen
        60
    quietjosen  
    OP
       2017-11-30 18:28:34 +08:00
    @linxijun 上面的回复一看便知。
    dai269619118
        61
    dai269619118  
       2017-11-30 18:31:43 +08:00
    良心楼主 工具非常好用 价格还这么低
    Kei
        62
    Kei  
       2017-11-30 18:40:48 +08:00
    不了日呢 = =
    提供例子: ありがとう
    hester
        63
    hester  
       2017-11-30 18:49:27 +08:00
    @iyaozhen
    原来如此,感谢告知~

    @quietjosen
    我不会 chrome extension,我只是认为没必要单独做一个 app,正如你认为有必要做一样。
    只是很反感还是订阅,尤其是纯工具类的。。。
    话说,从你的文章就能看出‘‘我是独立开发者,我很不容易,所以花你点钱用订阅制,能支撑我继续独立开发者’’这种味道。。。独立开发者做的 app 就应该是订阅制吗?这跟创业型公司 = 加班 岂不是一个道理?

    说话直,别见怪,只是看不惯这些乱七八糟的怪现象。。。
    quietjosen
        64
    quietjosen  
    OP
       2017-11-30 18:53:54 +08:00   1
    @Kei 终端运行下面的命令,强制使用 Google ;之后会在菜单中提供入口。

    defaults write ~/Library/Containers/net.toolinbox.iText/Data/Library/Preferences/net.toolinbox.iText.plist OCRService "Google"
    quietjosen
        65
    quietjosen  
    OP
       2017-11-30 18:56:22 +08:00
    @hester 还是先看下我文末关于付费模式的思考吧。「从你的文章就能看出」,我并不能理解你推理的逻辑;你得到的苦情结论,是你想得出的结论。比如,你看看#61 楼的回复,并不是每个人都有相同的理解。
    linxijun
        66
    linxijun  
       2017-11-30 19:02:02 +08:00
    @quietjosen 懂了。。。。。
    hanzichi
        67
    hanzichi  
       2017-11-30 19:03:30 +08:00
    @quietjosen 谢谢
    Kei
        68
    Kei  
       2017-11-30 19:12:57 +08:00
    SquirrelMAN
        69
    SquirrelMAN  
       2017-11-30 19:35:28 +08:00
    作者的各种作品,需求把握得都很到位。
    quietjosen
        70
    quietjosen  
    OP
       2017-11-30 19:37:22 +08:00
    @SquirrelMAN 其实也有无心插柳的成分;我正在写 iText 从头开始的完整经历,下周会在 GitChat 上发。
    SNOOPY963
        71
    SNOOPY963  
       2017-11-30 20:45:45 +08:00
    艺高心细

    日常帮顶
    quietjosen
        72
    quietjosen  
    OP
       2017-11-30 21:15:37 +08:00
    @SNOOPY963 谢谢支持
    ewBuyVmLZMZE
        73
    ewBuyVmLZMZE  
       2017-11-30 22:54:30 +08:00
    iPic 一年后的续费价格让我离开。这次目测也是。
    puritania
        74
    puritania  
       2017-12-02 17:11:47 +08:00
    菜单栏图标太丑
    nine99
        75
    nine99  
       2017-12-03 16:45:36 +08:00
    支持
    jaylong
        76
    jaylong  
       2017-12-05 10:46:03 +08:00   1
    t/411218 开源替代品
    quietjosen
        77
    quietjosen  
    OP
       2017-12-05 13:30:50 +08:00
    @jaylong 既然你提了,我扔 2 张图,你试试段落识别吧。其他的细节和优化,我就不提了。




    以及我在做段落识别时的一些素材:

    luokr
        78
    luokr  
       2017-12-06 10:43:05 +08:00
    @syhily 哈哈楼主自己说了他是奸商
    hanzichi
        79
    hanzichi  
       2017-12-07 11:0:28 +08:00
    楼主,我又来请教了 ... 想入门 macOS 开发,网上搜了下资料好少,有没有推荐的网站或者书籍或者简单的 demo ? swift 语言

    楼主能不能分享下自己的入门经验呢 ... 跪谢
    quietjosen
        80
    quietjosen  
    OP
       2017-12-07 19:50:35 +08:00   1
    @hanzichi 我之前写过这篇文章:

    Mac 开发的神秘面纱:后娘养的嫡长子
    https://atjason.com/IndieDev/2017-07-18.html
    hanzichi
        81
    hanzichi  
       2017-12-07 20:45:35 +08:00
    @quietjosen 您推荐的那本书是只有英文版的嘛?
    quietjosen
        82
    quietjosen  
    OP
       2017-12-08 08:44:38 +08:00
    @hanzichi 我看的是英文版,中文版没了解过。
    关于     帮助文档     自助推广系统     博客     API     FAQ     Solana     2186 人在线   最高记录 6679       Select Language
    创意工作者们的社区
    World is powered by solitude
    VERSION: 3.9.8.5 33ms UTC 00:40 PVG 08:40 LAX 17:40 JFK 20:40
    Do have faith in what you're doing.
    ubao snddm index pchome yahoo rakuten mypaper meadowduck bidyahoo youbao zxmzxm asda bnvcg cvbfg dfscv mmhjk xxddc yybgb zznbn ccubao uaitu acv GXCV ET GDG YH FG BCVB FJFH CBRE CBC GDG ET54 WRWR RWER WREW WRWER RWER SDG EW SF DSFSF fbbs ubao fhd dfg ewr dg df ewwr ewwr et ruyut utut dfg fgd gdfgt etg dfgt dfgd ert4 gd fgg wr 235 wer3 we vsdf sdf gdf ert xcv sdf rwer hfd dfg cvb rwf afb dfh jgh bmn lgh rty gfds cxv xcv xcs vdas fdf fgd cv sdf tert sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf shasha9178 shasha9178 shasha9178 shasha9178 shasha9178 liflif2 liflif2 liflif2 liflif2 liflif2 liblib3 liblib3 liblib3 liblib3 liblib3 zhazha444 zhazha444 zhazha444 zhazha444 zhazha444 dende5 dende denden denden2 denden21 fenfen9 fenf619 fen619 fenfe9 fe619 sdf sdf sdf sdf sdf zhazh90 zhazh0 zhaa50 zha90 zh590 zho zhoz zhozh zhozho zhozho2 lislis lls95 lili95 lils5 liss9 sdf0ty987 sdft876 sdft9876 sdf09876 sd0t9876 sdf0ty98 sdf0976 sdf0ty986 sdf0ty96 sdf0t76 sdf0876 df0ty98 sf0t876 sd0ty76 sdy76 sdf76 sdf0t76 sdf0ty9 sdf0ty98 sdf0ty987 sdf0ty98 sdf6676 sdf876 sd876 sd876 sdf6 sdf6 sdf9876 sdf0t sdf06 sdf0ty9776 sdf0ty9776 sdf0ty76 sdf8876 sdf0t sd6 sdf06 s688876 sd688 sdf86