AI 中,同样的模型,在不同显卡上运行,结果会有差异吗? - V2EX
V2EX = way to explore
V2EX 是一个关于分享和探索的地方
现在注册
已注册用户请  登录
among
0.01D
V2EX    机器学习

AI 中,同样的模型,在不同显卡上运行,结果会有差异吗?

  •  
  •   among 2022-12-14 17:34:05 +08:00 2362 次点击
    这是一个创建于 1034 天前的主题,其中的信息可能已经有所发展或是发生改变。
    一个模型文件,做图片中的文本识别的,onnx 格式,运行的程序也是一样的。


    在 2 个不同的机器,windows 和 linux ,对接的显卡型号不一样,windows 是 3080i ,T4

    发现同一个图片,在 2 个机器上识别出的结果会有差异,有的识别成功,有的识别不了。



    对 AI 不熟,想问一下,这样的差异正常吗?


    顺便问个:有没有比较好的,识别图片中文字或图标的开源框架,可以返回坐标及其文字的。
    4 条回复    2023-03-31 09:52:27 +08:00
    jack4in
        1
    jack4in  
       2022-12-14 19:23:42 +08:00
    百度的 paddleocr
    lhggame
        2
    lhggame  
       2022-12-27 15:40:29 +08:00
    在训练机器学习模型时,使用不同的显卡可能会导致训练时间的差异。但是,一旦模型训练完成并在不同的设备上运行,它应该会产生相同的结果。这是因为在训练过程中所学到的权重和偏差已经被固化到模型中,并且在不同的设备上进行推理时,它们应该会产生相同的输出。

    但是,在推理过程中,使用不同的显卡可能会导致性能差异。这是因为某些显卡可能更快,更有效地执行特定的计算操作,这可能会导致推理速度的差异。

    总的来说,使用不同的显卡可能会导致训练时间的差异,但在推理过程中应该会产生相同的结果,但可能会有性能差异。
    among
        3
    among  
    OP
       2022-12-27 16:21:29 +08:00
    @lhggame
    机器回答???
    oceaniaxie
        4
    oceaniaxie  
       2023-03-31 09:52:27 +08:00
    可不可以把不同机器的模型推理库和 CUDA/CuDNN 分别列一下?包括版本。能想到的影响推理结果的因素:1. 有些推理引擎 /库会进行模型量化( Quantization ),比如把 FP32 浮点数压缩成 FP16 浮点数甚至 INT8 整数,当然会影响结果了。2.有些复杂一点的模型操作,在不同推理库中的实现方式有差异。3.图像数据前处理方式有差异,比如是不是用了相同的参数进行 Normalization 、是不是 Reszie 成了相同的大小? 4.识别结果后处理方式有差异,比如非极大抑制 NMS 参数是不是相同的?置信度阈值是否一样?

    如果要进行细致的排错,可以按步骤来,分别在两个推理环境中,用同一张图片作为输入,输出前处理后的图像、特征层、模型输出、后处理之后的结果等等中间结果。然后就可以定位到问题出在哪个环节了。
    关于     帮助文档     自助推广系统     博客     API     FAQ     Solana     953 人在线   最高记录 6679       Select Language
    创意工作者们的社区
    World is powered by solitude
    VERSION: 3.9.8.5 25ms UTC 19:53 PVG 03:53 LAX 12:53 JFK 15:53
    Do have faith in what you're doing.
    ubao snddm index pchome yahoo rakuten mypaper meadowduck bidyahoo youbao zxmzxm asda bnvcg cvbfg dfscv mmhjk xxddc yybgb zznbn ccubao uaitu acv GXCV ET GDG YH FG BCVB FJFH CBRE CBC GDG ET54 WRWR RWER WREW WRWER RWER SDG EW SF DSFSF fbbs ubao fhd dfg ewr dg df ewwr ewwr et ruyut utut dfg fgd gdfgt etg dfgt dfgd ert4 gd fgg wr 235 wer3 we vsdf sdf gdf ert xcv sdf rwer hfd dfg cvb rwf afb dfh jgh bmn lgh rty gfds cxv xcv xcs vdas fdf fgd cv sdf tert sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf shasha9178 shasha9178 shasha9178 shasha9178 shasha9178 liflif2 liflif2 liflif2 liflif2 liflif2 liblib3 liblib3 liblib3 liblib3 liblib3 zhazha444 zhazha444 zhazha444 zhazha444 zhazha444 dende5 dende denden denden2 denden21 fenfen9 fenf619 fen619 fenfe9 fe619 sdf sdf sdf sdf sdf zhazh90 zhazh0 zhaa50 zha90 zh590 zho zhoz zhozh zhozho zhozho2 lislis lls95 lili95 lils5 liss9 sdf0ty987 sdft876 sdft9876 sdf09876 sd0t9876 sdf0ty98 sdf0976 sdf0ty986 sdf0ty96 sdf0t76 sdf0876 df0ty98 sf0t876 sd0ty76 sdy76 sdf76 sdf0t76 sdf0ty9 sdf0ty98 sdf0ty987 sdf0ty98 sdf6676 sdf876 sd876 sd876 sdf6 sdf6 sdf9876 sdf0t sdf06 sdf0ty9776 sdf0ty9776 sdf0ty76 sdf8876 sdf0t sd6 sdf06 s688876 sd688 sdf86