各个 ai 平台稍微复杂的代码测试 - V2EX
V2EX = way to explore
V2EX 是一个关于分享和探索的地方
现在注册
已注册用户请  登录
lyxxxh2
V2EX    OpenAI

各个 ai 平台稍微复杂的代码测试

  •  
  •   lyxxxh2 320 天前 1681 次点击
    这是一个创建于 320 天前的主题,其中的信息可能已经有所发展或是发生改变。

    给 ai 的问题

    我有一个 yolov8 模型,路径:/media/duyu/model/have_and_none/runs/detect/train66/weights/best.pt 训练集路径:train/labels train/images 验证集路径:val/labels val/labels 训练集和验证集都是 labelme 软件标注的,标注文件也就是.json 文件,labele 这个软件挺多人用的,你应该知道。 有 3 个标签:have none other,对应的 yolov8 就是 0 1 2 现在我需要你根据我提供信息编写验证模型正确率的脚本。 示例流程: 1. 推理图片: train/images/1.jpg 2. 打开图片对应的标注文件,获取标注文件的框。 3. 将标注的框和推理框进行 iou 匹配,即两个框 iou 有.4,则可以判定为同个框 4. 如果标注的框都能找到推理框,且标签正确,则判定此张图片没问题。 5. 没问题就可以结束这张图的处理了 6. 此时是有问题了,即: 有标注框找不到推理框,或者找到的框标签错误。 7. 标注框和推理框画在图片上,框左边加上字符串标识 - 如: "l_have" "y_none" (l 代表 labelme 的框 y 代表 yolo 的推理框) 8. 保存图片到 model_test 文件夹,文件别改变。 请编写脚本 

    gpt

    https://i.imgur.com/vlYshea.png

    1. import 一堆库,又不使用
    2. 加载模型 torch.load,官方写得那么清楚,国内的 ai 都不会犯这个错。
      • 给我感觉,就是故意恶心人。

    豆包

    https://i.imgur.com/2Xp9rjN.png

    import os 呢??? 我手动给他补上,执行脚本。 https://i.imgur.com/nZAObvG.png 看来对库认知有问题

    通义

    https://i.imgur.com/zETA2WA.png

    连我话都理解错,我只是举例而已。

    感觉就像: 太复杂了,我逃避,忽悠过去得了。

    通义是我印象最差的,来自之前的积累,傻逼的不像话。

    https://i.imgur.com/MHZuRGs.png

    文心

    https://i.imgur.com/RReliS8.png

    1. 上面有 import cv2,又不用,学 gpt 是吧。
    2. arial.ttf 我又没这个文件
    5 条回复    2025-02-26 10:48:23 +08:00
    yiios
        1
    yiios  
       320 天前
    通过 chat 界面来对话测试不太合适,建议直接使用大模型竞技场 https://lmarena.ai/ 来对比测试,没有预制的提示语,更准确。
    PearDecOne
        2
    PearDecOne  
       319 天前
    千问你找错地方了,真正的 Qwen 团队的项目是 qwenlm ,你这是用的是通义千问,落后真正的 Qwen 团队好几个版本迭代
    地址: https://chat.qwenlm.ai/
    lyxxxh2
        3
    lyxxxh2  
    OP
       318 天前
    @PearDecOne
    刚看你消息,原来是我用错姿势了。

    ***
    然后我将旧问题给千问,让我无语,一样智障。


    ```
    1. 3447682963FLOPs
    2. 14243643203FLOPs
    3. 2.7GFLOPs
    4. 2707554304FLOPs
    5. 28600000000FLOPs

    求以上加起来,并换算成 tops 。
    ```
    shinebak
        4
    shinebak  
       278 天前
    shinebak
        5
    shinebak  
       278 天前
    关于     帮助文档     自助推广系统     博客     API     FAQ     Solana     1536 人在线   最高记录 6679       Select Language
    创意工作者们的社区
    World is powered by solitude
    VERSION: 3.9.8.5 26ms UTC 16:33 PVG 00:33 LAX 08:33 JFK 11:33
    Do have faith in what you're doing.
    ubao msn snddm index pchome yahoo rakuten mypaper meadowduck bidyahoo youbao zxmzxm asda bnvcg cvbfg dfscv mmhjk xxddc yybgb zznbn ccubao uaitu acv GXCV ET GDG YH FG BCVB FJFH CBRE CBC GDG ET54 WRWR RWER WREW WRWER RWER SDG EW SF DSFSF fbbs ubao fhd dfg ewr dg df ewwr ewwr et ruyut utut dfg fgd gdfgt etg dfgt dfgd ert4 gd fgg wr 235 wer3 we vsdf sdf gdf ert xcv sdf rwer hfd dfg cvb rwf afb dfh jgh bmn lgh rty gfds cxv xcv xcs vdas fdf fgd cv sdf tert sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf shasha9178 shasha9178 shasha9178 shasha9178 shasha9178 liflif2 liflif2 liflif2 liflif2 liflif2 liblib3 liblib3 liblib3 liblib3 liblib3 zhazha444 zhazha444 zhazha444 zhazha444 zhazha444 dende5 dende denden denden2 denden21 fenfen9 fenf619 fen619 fenfe9 fe619 sdf sdf sdf sdf sdf zhazh90 zhazh0 zhaa50 zha90 zh590 zho zhoz zhozh zhozho zhozho2 lislis lls95 lili95 lils5 liss9 sdf0ty987 sdft876 sdft9876 sdf09876 sd0t9876 sdf0ty98 sdf0976 sdf0ty986 sdf0ty96 sdf0t76 sdf0876 df0ty98 sf0t876 sd0ty76 sdy76 sdf76 sdf0t76 sdf0ty9 sdf0ty98 sdf0ty987 sdf0ty98 sdf6676 sdf876 sd876 sd876 sdf6 sdf6 sdf9876 sdf0t sdf06 sdf0ty9776 sdf0ty9776 sdf0ty76 sdf8876 sdf0t sd6 sdf06 s688876 sd688 sdf86