便宜的大模型 API 推荐? - V2EX
V2EX = way to explore
V2EX 是一个关于分享和探索的地方
现在注册
已注册用户请  登录
请不要在回答技术问题时复制粘贴 AI 生成的内容
xinbaoCode
V2EX    程序员

便宜的大模型 API 推荐?

  •  
  •   xinbaoCode 2024-03-19 10:05:48 +08:00 9922 次点击
    这是一个创建于 572 天前的主题,其中的信息可能已经有所发展或是发生改变。

    听说阿里云的通义千问 API 收费了,看了下价格。

    阿里云 ==> 0.12 元/1000tokens

    我看了下,我最近 20 天就用了大概 1000 * 1000 tokens,还好在免费额度里,算了下账,都差点要 120 远了,还好目前是免费的

    果断弃用,xdm ,还有什么便宜的 API 调用不?目前我了解到的最低价格是

    GPT4 ==> 0.024 元/1000 tokens

    51 条回复    2024-08-18 00:19:06 +08:00
    noahlias
        1
    noahlias  
       2024-03-19 10:11:22 +08:00   1
    国内的:
    kimi/ deepseek/ chatglm/ 01-ai/讯飞星火

    或者你用一个 sass 服务比如 https://openrouter.ai/
    市面上的大模型基本都有(开源或者闭源)
    WANHOO
        2
    WANHOO  
       2024-03-19 10:17:41 +08:00
    我用的 gpt4 0.07 /1k token
    fredweili
        3
    fredweili  
       2024-03-19 10:17:58 +08:00
    有一些算力的,自己部署开源模型,白嫖
    LeslieLeung
        4
    LeslieLeung  
       2024-03-19 10:21:28 +08:00   1
    如果能搞定绑卡支付,还是用 OpenAI 官方的省心:

    - 不限制不能并发(具体还是要看帐号的等级,而转发站现在 GPT 4 不能并发)
    - 转发站莫名其妙会请求失败(用过两三个,有一两个会出现这样的状况)

    又想省钱又想省心的办法可以自建一个 one-api ,然后加一个官方渠道,加几个一折左右的转发站,用它的负载均衡功能来达到省钱和稳定的目的。

    如果完全不想花钱,可以试试 ollama ,像 gemma7B 这种主观感觉跟 GPT 3.5 Turbo 差不多。
    tiantangtianma
        5
    tiantangtianma  
       2024-03-19 10:30:43 +08:00 via iPhone
    @fredweili 有开源模型推荐吗
    fredweili
        6
    fredweili  
       2024-03-19 10:36:54 +08:00
    @tiantangtianma meta LLaMA2
    xinbaoCode
        7
    xinbaoCode  
    OP
       2024-03-19 10:50:45 +08:00
    @noahlias 听闻 kimi 火,我去研究,
    holdeer
        8
    holdeer  
       2024-03-19 11:10:36 +08:00
    为什么选择最贵的?
    xinbaoCode
        9
    xinbaoCode  
    OP
       2024-03-19 11:19:48 +08:00
    @holdeer 哈,并没有呀,GPT4 国内的 sass 只要 0.024 元
    xinbaoCode
        10
    xinbaoCode  
    OP
       2024-03-19 11:29:53 +08:00
    @noahlias 感觉 kiwi 也蛮贵的,moonshot-v1-32k 的 1M 上下文差不多也要 24 元了。
    Ivone29
        11
    Ivone29  
       2024-03-19 11:50:36 +08:00
    我使用 OpenRouter 免费的 API
    crackidz
        12
    crackidz  
       2024-03-19 12:13:36 +08:00
    成本在这,再怎么便宜也不会差距很大
    noahlias
        13
    noahlias  
       2024-03-19 12:16:32 +08:00
    @xinbaoCode 你说的 gpt-4 能支持并发吗?据我所知国内的这些第三方 应该是没有很高的 gpt-4 使用的 tier 的 而且很多 gpt-4 都是用 azure 套壳的 并不是 openai 的
    我记得 coze 的 dalle 的图就是微软的

    8eacekeep
        14
    8eacekeep  
       2024-03-19 12:20:42 +08:00
    吓得我去看了下 api ,发现 3.5 用了俩月,终于用了 1 刀了
    hahastudio
        15
    hahastudio  
       2024-03-19 12:30:27 +08:00
    Gemini 有免费额度
    https://ai.google.dev/pricing
    street000
        16
    street000  
       2024-03-19 12:42:59 +08:00 via Android
    gemini 目前免费但是 api 很难用还不稳定
    qdlidada
        17
    qdlidada  
       2024-03-19 13:39:08 +08:00
    qwen-turbo 0.008 元 1000tokens
    xinbaoCode
        18
    xinbaoCode  
    OP
       2024-03-19 13:52:10 +08:00
    @qdlidada turbo 感觉回答问题不太精准哈,还是不太敢用
    walle1530
        19
    walle1530  
       2024-03-19 13:56:47 +08:00
    shiyuu
        20
    shiyuu  
       2024-03-19 14:28:17 +08:00
    @walle1530 这个不支持 gpt4 吧
    jiurenmeng
        21
    jiurenmeng  
       2024-03-1 14:31:52 +08:00
    楼主说的 gpt4 0.024 是哪个
    sywsy
        22
    sywsy  
       2024-03-19 14:35:47 +08:00   1
    gemini 免费,买个域名在 cloudflare 上转发下国内就能访问了
    leantli
        23
    leantli  
       2024-03-19 14:42:12 +08:00
    chatglm4 0.1 元/1k tokens, 国内的模型算中文 tokens 比国外的少, 要用的话建议就是英文 gpt4, 中文 chatglm4, 不追求回答质量的话那选择更是非常多了
    等 claude-3-haiku api 放出来, 感觉可以考虑用这个, 看官网评测性能虽然弱于 gpt4, 但差距没有特别大, 而且看起来价格可能会很便宜
    xinbaoCode
        24
    xinbaoCode  
    OP
       2024-03-19 15:35:34 +08:00
    @jiurenmeng 这个 https://api.kksj.me/ ,之前他们在 V2EX 推荐过,感觉还不错我就购买了,不过只买了 10 块钱
    incubus
        25
    incubus  
       2024-03-19 17:52:34 +08:00
    wensonsmith
        26
    wensonsmith  
       2024-03-19 18:01:28 +08:00
    简单问题本地 ollama ( mistral/qwen-13b 这俩效果可以),M 芯片跑起来挺快

    复杂问题 Kimi / ChatGPT 4
    kneo
        27
    kneo  
       2024-03-19 20:19:29 +08:00 via Android
    为什么挑便宜的?便宜的能好用?一百多还不够一小时工资吧。
    coinbase
        28
    coinbase  
       2024-03-19 20:27:01 +08:00
    直接本地搭建一个 Qwen 7b 的,基本够用了应该,一张 4090 就可以跑
    yb8Qes1Qae01H0xy
        29
    yb8Qes1Qae01H0xy  
       2024-03-19 20:27:07 +08:00 via iPhone
    @wensonsmith 需要 gpu ?还是 cpu 也可以?
    richarddingcn
        30
    richarddingcn  
       2024-03-19 20:46:13 +08:00
    aws claude 3?
    luckykong
        31
    luckykong  
       2024-03-19 21:16:43 +08:00
    @wensonsmith #26 qwen-13b 是哪个? 是 14B 么?
    想问一下你跑的哪个版本?速度怎么样?我用过一个,感觉有些慢,难道是我配置不行。。。。
    akatale
        32
    akatale  
       2024-03-19 21:32:12 +08:00
    与其找便宜的不如找效果最好的,要便宜有免费的那最便宜
    lekai63
        33
    lekai63  
       2024-03-19 22:47:51 +08:00
    我目前也用的是国内的转发站 ,大体就是 0.8 元人民币 ==> 1 美元额度。
    算下来就是楼上的 0.024/1k tokens 吧

    不过目前也就个人用用,冲了 200 刀( 160 人民币)。claude 3 的三个相关模型,gpt-4 的模型 看起来都能用。
    lekai63
        34
    lekai63  
       2024-03-19 22:49:04 +08:00
    所以不知道并发情况。之前还纳闷这些转发站的上游渠道,那现在似乎优点明白了:
    gpt-4 ---> Azure
    claude ---> AWS
    SiWXie
        35
    SiWXie  
       2024-03-19 22:50:15 +08:00 via iPhone
    @lekai63 老哥用的那家的,推荐下,最近想试试
    lekai63
        36
    lekai63  
       2024-03-19 23:04:58 +08:00   1
    @SiWXie 我去看了看,这家没 aff 啊,心好痛啊。

    还好他家域名短,辛苦老哥看图片
    ![]( https://r2pub.quarkmed.com/2024/03/b531235d24f7d61eb1edaa93e0dc203b.png)

    真广告位出租
    wensonsmith
        37
    wensonsmith  
       2024-03-20 01:45:55 +08:00
    @xinmans
    @luckykong

    纯 CPU 就可以。M1 Pro, 16G 跑着挺快

    对,14b 我说错了。

    Xiritianming
        38
    Xiritianming  
       2024-03-20 08:25:52 +08:00
    together.ai 有 25 美刀额度免费
    kneo
        39
    kneo  
       2024-03-20 09:53:49 +08:00 via Android
    @wensonsmith 这些本地“小模型”只能跑点文科东西,反正对我来说基本上没法用。快倒是真快,刷刷刷好几屏我眼睛都跟不上。
    tiantangtianma
        40
    tiantangtianma  
       2024-03-20 10:23:04 +08:00 via iPhone
    @fredweili 谢谢
    tiantangtianma
        41
    tiantangtianma  
       2024-03-20 10:23:14 +08:00 via iPhone
    @incubus 谢谢
    yb8Qes1Qae01H0xy
        42
    yb8Qes1Qae01H0xy  
       2024-03-20 10:49:52 +08:00 via iPhone
    @wensonsmith 支持中文不
    cnhh
        43
    cnhh  
       2024-03-20 13:03:10 +08:00
    低价的中转 API 平台上线 Claude 3 Opus 模型了

    https://v2ex.com/t/1019642
    wensonsmith
        44
    wensonsmith  
       2024-03-20 14:24:27 +08:00
    @xinmans #42 qwen-13b ,国内的模型中文支持好些。mistral 中文很烂
    wensonsmith
        45
    wensonsmith  
       2024-03-20 14:24:46 +08:00
    @kneo #39

    写点 python 代码没问题的
    SantinoSong
        46
    SantinoSong  
       2024-03-21 10:55:58 +08:00
    @cnhh #43 他们家稳定性不行,便宜是便宜
    cnhh
        47
    cnhh  
       2024-03-21 11:36:38 +08:00
    @SantinoSong 现在挺稳了
    syozzz
        48
    syozzz  
       2024-03-21 19:54:26 +08:00
    @cnhh 这家原价的全是 7r=1 刀的,用不起
    cnhh
        49
    cnhh  
       2024-03-22 03:54:33 +08:00
    @syozzz 就 3 个模型是原价
    fakecoder
        50
    fakecoder  
       2024-06-13 14:37:44 +08:00
    @Xiritianming #38 刚才试了下,好像就 5 美刀了
    YongXMan
        51
    YongXMan  
       2024-08-18 00:19:06 +08:00 via Android
    推荐一下国内直连的大模型平台,支持 gpt-4o claude 3.5 等常用大模型 https://datapipe.app
    关于     帮助文档     自助推广系统     博客     API     FAQ     Solana     2716 人在线   最高记录 6679       Select Language
    创意工作者们的社区
    World is powered by solitude
    VERSION: 3.9.8.5 83ms UTC 08:48 PVG 16:48 LAX 01:48 JFK 04:48
    Do have faith in what you're doing.
    ubao snddm index pchome yahoo rakuten mypaper meadowduck bidyahoo youbao zxmzxm asda bnvcg cvbfg dfscv mmhjk xxddc yybgb zznbn ccubao uaitu acv GXCV ET GDG YH FG BCVB FJFH CBRE CBC GDG ET54 WRWR RWER WREW WRWER RWER SDG EW SF DSFSF fbbs ubao fhd dfg ewr dg df ewwr ewwr et ruyut utut dfg fgd gdfgt etg dfgt dfgd ert4 gd fgg wr 235 wer3 we vsdf sdf gdf ert xcv sdf rwer hfd dfg cvb rwf afb dfh jgh bmn lgh rty gfds cxv xcv xcs vdas fdf fgd cv sdf tert sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf shasha9178 shasha9178 shasha9178 shasha9178 shasha9178 liflif2 liflif2 liflif2 liflif2 liflif2 liblib3 liblib3 liblib3 liblib3 liblib3 zhazha444 zhazha444 zhazha444 zhazha444 zhazha444 dende5 dende denden denden2 denden21 fenfen9 fenf619 fen619 fenfe9 fe619 sdf sdf sdf sdf sdf zhazh90 zhazh0 zhaa50 zha90 zh590 zho zhoz zhozh zhozho zhozho2 lislis lls95 lili95 lils5 liss9 sdf0ty987 sdft876 sdft9876 sdf09876 sd0t9876 sdf0ty98 sdf0976 sdf0ty986 sdf0ty96 sdf0t76 sdf0876 df0ty98 sf0t876 sd0ty76 sdy76 sdf76 sdf0t76 sdf0ty9 sdf0ty98 sdf0ty987 sdf0ty98 sdf6676 sdf876 sd876 sd876 sdf6 sdf6 sdf9876 sdf0t sdf06 sdf0ty9776 sdf0ty9776 sdf0ty76 sdf8876 sdf0t sd6 sdf06 s688876 sd688 sdf86