文心一言测试 - V2EX
V2EX = way to explore
V2EX 是一个关于分享和探索的地方
现在注册
已注册用户请  登录
waler
V2EX    分享发现

文心一言测试

  •  
  •   waler 2023 年 3 月 17 日 5103 次点击
    这是一个创建于 1036 天前的主题,其中的信息可能已经有所发展或是发生改变。
    30 条回复    2023-03-20 17:02:40 +08:00
    waler
        1
    waler  
    OP
       2023 年 3 月 17 日
    14v45mJPBYJW8dT7
        2
    14v45mJPBYJW8dT7  
       2023 年 3 月 17 日   1
    其实还不错,稳步更新中
    stabc
        3
    stabc  
       2023 年 3 月 18 日
    它只是把百家号的自动生成工具拿出来了。百家号是啥德行大家都知道。
    tool2d
        4
    tool2d  
       2023 年 3 月 18 日   3
    一问一答这种只要训练集足够大,总能模糊匹配出一些看起来还可以的答案,拉不来明显差距。

    ChatGPT 惊艳的地方,不是回答问题的能力,而是分析问题的能力。

    能理解你语境和语句的内涵,这才是 AI 的魅力所在。
    misslita
        5
    misslita  
       2023 年 3 月 18 日 via iPhone   1
    多轮对话很弱没有记忆一样,就是一问一答其他模型也能做到,代码能力约等于没有,比较强的可能就是对于一些中文的理解,其实把生成图片和语音缝合进来很尬
    nomagick
        6
    nomagick  
       2023 年 3 月 18 日
    要知道 ChatGPT 刷新认知之后,对大模型的期望更多是战略层面上的,要能自动化进行情报收集分析和整理,辅助政策制定,要能模拟选民或者受众行为,还要能应用到军事,辅助战场指挥。最后是融入各行各业,具体推动社会发展。

    在民用领域聊几个闲天,这功能有没有,谁提供,无所谓。
    Elix
        7
    Elix  
       2023 年 3 月 18 日
    lhbc
        8
    lhbc  
       2023 年 3 月 18 日 via Android
    第一个其实是 Java 工程师的要求,几个框架全是 Java 的

    那个邮箱正则错了几个地方:
    用户名漏了 _
    域名是可以单个字母数字的,它限制了至少两个
    多了个空格
    lhbc
        9
    lhbc  
       2023 年 3 月 18 日 via Android
    @tool2d 完全赞同。
    需要设计一些精妙的问题来测试 AI 这方面的能力
    lhbc
        10
    lhbc  
       2023 年 3 月 18 日 via Android
    @Elix 不要问天气了,天气这种级别的问 siri 小爱就行
    lhbc
        11
    lhbc  
       2023 年 3 月 18 日 via Android
    粗略地说,超出我预期了
    liuguangxuan
        12
    liuguangxuan  
       2023 年 3 月 18 日 via Android   1
    @lhbc 你只看到了他问天气,没看到他的 02.29
    lhbc
        13
    lhbc  
       2023 年 3 月 18 日 via Android
    @liuguangxuan 没有意义。
    你确定文心一言会即时联网或者训练数据包括了天气数据并且语料时间在 2 月 29 号之后吗?
    cat333
        14
    cat333  
       2023 年 3 月 18 日
    脑筋急转弯还是不行
    lhbc
        15
    lhbc  
       2023 年 3 月 18 日 via Android
    @liuguangxuan 也不用测试它是否会判断闰年之类,AI 不是这样检索问题的
    SOIi9V663C4ahnIU
        16
    SOIi9V663C4ahnIU  
       2023 年 3 月 18 日   1
    @cat333 #14 哈哈,有待加强,起码说明不是照搬 openai 、有思考性
    lhbc
        17
    lhbc  
       2023 年 3 月 18 日 via Android
    低级问题只能 garbage in garbage out
    Elix
        18
    Elix  
       2023 年 3 月 18 日
    @lhbc 不是我问的,你仔细看看图。
    Elix
        19
    Elix  
       2023 年 3 月 18 日
    @lhbc 请问 2023 年的 2 月有 29 日么?还是说文心一言用玛雅历?
    LightOrange
        20
    LightOrange  
       2023 年 3 月 18 日
    yaoyaomoe
        21
    yaoyaomoe  
       2023 年 3 月 18 日 via iPhone

    笑死
    lhbc
        22
    lhbc  
       2023 年 3 月 18 日 via Android
    @Elix 我说了,garbage in garbage out
    baiduyixia
        23
    baiduyixia  
       2023 年 3 月 18 日
    @lhbc 无语,你没看懂吗? 2023 年 2 月没有 29 日,只有 28 日,楼上问了一个不存在的日期,结果还给出了天气预报
    lhbc
        24
    lhbc  
       2023 年 3 月 18 日
    @baiduyixia 我看到了啊,上面我都说了它不一定会判断闰年
    GPT 不是这样用的,这种问题根本没理解 GPT 的工作原理
    这种问题就是 garbage in garbage out
    lhbc
        25
    lhbc  
       2023 年 3 月 18 日
    @baiduyixia 我问 ChatGPT 『 2021 年 2 月 29 号是星期几?』
    它回到我『 2021 年 2 月 29 日是星期一。』

    GPT 不是这样用的,这没法体现出文心一言的水平如何
    garbage in garbage out ,明白了吗?

    https://imgur.com/a/1OKQGMd
    gam2046
        26
    gam2046  
       2023 年 3 月 18 日
    @baiduyixia #23 这类深度学习,用人类语言来说,就是都通过相关性给出的结果,而非逻辑性。问日期这种是没有意义的。没有办法提醒出模型训练过程的相关性结果。

    类似的,就算你问他一加一等于几,它回答等于三,也不等于它是垃圾。
    sleepyfevniv
        27
    sleepyfevniv  
       2023 年 3 月 18 日
    有没有可能,2.29 那天,就是 3.1,?
    binux
        28
    binux  
       2023 年 3 月 18 日 via Android
    比我想的要好
    昨天的 V2:chatppt
    今天的 V2:不如 chatgpt
    和着反正做什么都是错的
    lhbc
        29
    lhbc  
       2023 年 3 月 18 日 via Android
    @sleepybear1113 不是的。语言模型并没有这样的能力
    问它逻辑题、脑筋急转弯都没意义,即使回答对了也不是推理出来,而是训练语料里的相关性检索出来的
    icharm
        30
    icharm  
       2023 年 3 月 20 日
    关于     帮助文档     自助推广系统     博客     API     FAQ     Solana     2511 人在线   最高记录 6679       Select Language
    创意工作者们的社区
    World is powered by solitude
    VERSION: 3.9.8.5 29ms UTC 15:38 PVG 23:38 LAX 07:38 JFK 10:38
    Do have faith in what you're doing.
    ubao msn snddm index pchome yahoo rakuten mypaper meadowduck bidyahoo youbao zxmzxm asda bnvcg cvbfg dfscv mmhjk xxddc yybgb zznbn ccubao uaitu acv GXCV ET GDG YH FG BCVB FJFH CBRE CBC GDG ET54 WRWR RWER WREW WRWER RWER SDG EW SF DSFSF fbbs ubao fhd dfg ewr dg df ewwr ewwr et ruyut utut dfg fgd gdfgt etg dfgt dfgd ert4 gd fgg wr 235 wer3 we vsdf sdf gdf ert xcv sdf rwer hfd dfg cvb rwf afb dfh jgh bmn lgh rty gfds cxv xcv xcs vdas fdf fgd cv sdf tert sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf shasha9178 shasha9178 shasha9178 shasha9178 shasha9178 liflif2 liflif2 liflif2 liflif2 liflif2 liblib3 liblib3 liblib3 liblib3 liblib3 zhazha444 zhazha444 zhazha444 zhazha444 zhazha444 dende5 dende denden denden2 denden21 fenfen9 fenf619 fen619 fenfe9 fe619 sdf sdf sdf sdf sdf zhazh90 zhazh0 zhaa50 zha90 zh590 zho zhoz zhozh zhozho zhozho2 lislis lls95 lili95 lils5 liss9 sdf0ty987 sdft876 sdft9876 sdf09876 sd0t9876 sdf0ty98 sdf0976 sdf0ty986 sdf0ty96 sdf0t76 sdf0876 df0ty98 sf0t876 sd0ty76 sdy76 sdf76 sdf0t76 sdf0ty9 sdf0ty98 sdf0ty987 sdf0ty98 sdf6676 sdf876 sd876 sd876 sdf6 sdf6 sdf9876 sdf0t sdf06 sdf0ty9776 sdf0ty9776 sdf0ty76 sdf8876 sdf0t sd6 sdf06 s688876 sd688 sdf86