大模型改变了 OCR,做了个识别食品成分的小程序 - V2EX
V2EX = way to explore
V2EX 是一个关于分享和探索的地方
现在注册
已注册用户请  登录
/div>
爱意满满的作品展示区。
lidinghui
V2EX    分享创造

大模型改变了 OCR,做了个识别食品成分的小程序

  •  
  •   lidinghui 201 天前 3058 次点击
    这是一个创建于 201 天前的主题,其中的信息可能已经有所发展或是发生改变。

    大学时还在用 tesseract 来实现 OCR ,短短几年随着多模态大模型的崛起,OCR 技术正经历一场颠覆性变革它不再局限于“识别文字”,而是进化为一套能够理解上下文、推理语义、甚至主动纠错的“视觉认知系统”。

    用支持视觉的大模型接口开发了一个识别食品成分的小程序,不仅摒弃了传统 OCR 技术,更直接绕过了第三方食品数据库的调用环节。

    17 条回复    2025-03-28 10:33:40 +08:00
    hahasong
        1
    hahasong  
       201 天前
    调用的哪个平台,还是自己部署了一套
    lidinghui
        2
    lidinghui  
    OP
       201 天前
    @hahasong 硅基流动的 Qwen
    shdm520
        3
    shdm520  
       201 天前
    是本地部署的吗
    lidinghui
        4
    lidinghui  
    OP
       201 天前 via Android
    @shdm520 不是
    Solix
        5
    Solix  
       200 天前 via iPhone
    商业化路径,多加一步,推荐更健康的相同食品
    lidinghui
        6
    lidinghui  
    OP
       200 天前 via Android
    @gaobh Good idea
    mumbler
        7
    mumbler  
       200 天前
    chatgpt 出来前夕,正在开发一个拍照识别食物嘌呤,热量的小程序,有大模型简单多了,不过国内没什么人会为这种应用付费,国外同类产品已经千万级收入了
    yoruoxx
        8
    yoruoxx  
       200 天前
    wanlei ?
    root71370
        9
    root71370  
       200 天前 via Android
    @mumbler 国内只能看广告
    lidinghui
        10
    lidinghui  
    OP
       200 天前
    @yoruoxx 什么
    yoruoxx
        11
    yoruoxx  
       199 天前 via Android
    @lidinghui 没事没事,以为是一个朋友
    4UyQY0ETgHMs77X8
        12
    4UyQY0ETgHMs77X8  
       199 天前
    @mumbler #7 因为国内这些数据普通人不知道影响什么,国外健身人群和国内对比一下就知道了,国内都是在卷的路上谁在乎这个那个
    4UyQY0ETgHMs77X8
        13
    4UyQY0ETgHMs77X8  
       198 天前
    用了几天,今天第一次出问题,白色魔爪全部扫描识别完有点乱码合成一个了
    lidinghui
        14
    lidinghui  
    OP
       198 天前 via Android
    @FlorentinoAriza 什么图,我试试看
    4UyQY0ETgHMs77X8
        15
    4UyQY0ETgHMs77X8  
       198 天前
    @lidinghui #14 没保存,就是白色魔爪你给他弄扁了拍一下看看,可能配料太多的问题
    lidinghui
        16
    lidinghui  
    OP
       198 天前
    @FlorentinoAriza 确实有这个情况,已做修改
    4UyQY0ETgHMs77X8
        17
    4UyQY0ETgHMs77X8  
       197 天前
    @lidinghui #16 这执行力
    关于     帮助文档     自助推广系统     博客     API     FAQ     Solana     2595 人在线   最高记录 6679       Select Language
    创意工作者们的社区
    World is powered by solitude
    VERSION: 3.9.8.5 23ms UTC 15:04 PVG 23:04 LAX 08:04 JFK 11:04
    Do have faith in what you're doing.
    ubao snddm index pchome yahoo rakuten mypaper meadowduck bidyahoo youbao zxmzxm asda bnvcg cvbfg dfscv mmhjk xxddc yybgb zznbn ccubao uaitu acv GXCV ET GDG YH FG BCVB FJFH CBRE CBC GDG ET54 WRWR RWER WREW WRWER RWER SDG EW SF DSFSF fbbs ubao fhd dfg ewr dg df ewwr ewwr et ruyut utut dfg fgd gdfgt etg dfgt dfgd ert4 gd fgg wr 235 wer3 we vsdf sdf gdf ert xcv sdf rwer hfd dfg cvb rwf afb dfh jgh bmn lgh rty gfds cxv xcv xcs vdas fdf fgd cv sdf tert sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf shasha9178 shasha9178 shasha9178 shasha9178 shasha9178 liflif2 liflif2 liflif2 liflif2 liflif2 liblib3 liblib3 liblib3 liblib3 liblib3 zhazha444 zhazha444 zhazha444 zhazha444 zhazha444 dende5 dende denden denden2 denden21 fenfen9 fenf619 fen619 fenfe9 fe619 sdf sdf sdf sdf sdf zhazh90 zhazh0 zhaa50 zha90 zh590 zho zhoz zhozh zhozho zhozho2 lislis lls95 lili95 lils5 liss9 sdf0ty987 sdft876 sdft9876 sdf09876 sd0t9876 sdf0ty98 sdf0976 sdf0ty986 sdf0ty96 sdf0t76 sdf0876 df0ty98 sf0t876 sd0ty76 sdy76 sdf76 sdf0t76 sdf0ty9 sdf0ty98 sdf0ty987 sdf0ty98 sdf6676 sdf876 sd876 sd876 sdf6 sdf6 sdf9876 sdf0t sdf06 sdf0ty9776 sdf0ty9776 sdf0ty76 sdf8876 sdf0t sd6 sdf06 s688876 sd688 sdf86