- 从部署、厂商支持等角度来说
- 200w 以内显卡预算

1 Flagship9945 OP 有没有有经验的老哥 |
2 michaelzxp 5h 44m ago 摩尔 s5000 的 8 卡整机 |
3 Jiajin 5h 43m ago 腾 910B2 |
5 cocogovern 5h 15m ago 这么厉害的预算,是啥应用啊 |
6 DeYiAo 5h 15m ago 最合适的是 PPU 1 代,16 卡。 最近涨价了预算不知道够不够。 PPPU 2 代,刚发布,8 卡,能买得到应该是最佳。 考虑腾系列的前提是,你们技术能力极强且有 10 几人的底层工程师可以调试改 bug ,或者财大气粗让华为的工程师驻场。 |
7 Babbitt 5h 2m ago via Android 最近公司也有这需求,预算差不多,想部署 deepseek v4 |
8 Flagship9945 OP @cocogovern 这预算算少的了 |
9 Flagship9945 OP @DeYiAo 腾问题很多吗? |
10 yyttrr 5h 0m ago 除了华为卡都支持 cuda,但是 cuda 版本可能很老,而且需要的一些其他基础设施要自己实现,不过有大模型写这些也不算什么难事.避坑一些特殊规格的比如一卡两芯的,选比较新的卡都差不多,海光的挺好用的 |
11 skuuhui 4h 55m ago 没经验不推荐国产显卡部署,坑太多了。如果非要部署建议找那种专门承接离线大模型部署业务的公司,直接上门安装包售后那种。 |
12 Flagship9945 OP @skuuhui 信创没办法 |
13 Clannad0708 4h 45m ago 国产显卡性能差,你即使部署了本地大模型效果也远不如网页版的能力,只能说不清楚需求。 |
14 vandort 4h 39m ago 不知道你要部署什么模型,但是现在模型出的这么快,从尽可能支持最新的模型的角度来说,选显存大的,卡内带宽高的( 200W 也做不了多机互联),厂家支持到位的;符合前面三个条件下,选支持 FP8 ,最好能支持 MXFP4 的;这些都满足的情况下,选省电的,便宜的,能稳定供应的 |
15 Flagship9945 OP @Clannad0708 政府项目就这样,领导跟风拍板,最后往往草草了事,样子上说的过去就行。 |
16 cpper 4h 28m ago 这种部署最终都是浪费掉的,说实话 |
17 byteX 4h 28m ago 哎 信创 |
18 Flagship9945 OP @cpper 整条线上的人赚钱了, |
19 strobber16 4h 25m ago 微内核 |
20 Flagship9945 OP 有经验的老哥可以合作 |
21 diudiuu 4h 21m ago 看显存和带宽,合适就买 |
22 cpper 4h 21m ago @Flagship9945 因为可以收回扣的 |
23 cpper 4h 20m ago @Flagship9945 并不是他们蠢所以拍屁股做的决策,而是因为可以收回扣,有利益 |
24 xiaxichen 4h 18m ago 我测过几家的显卡只能说阿里的 ppu 还是能用的,其他的都不太行.尤其吹的锣鼓震天响的华为. |
25 newaccount 3h 35m ago 政府项目不要瞎搞,你想部署哪个模型,联系对方咨询软硬件环境,人家也乐于多几个样板工程 |
26 catazshadow 3h 31m ago via Android 纳税人的钱就这么被烧掉了 |
27 mingtdlb 3h 28m ago 国产都有哪些 GPU ?华为腾、天数智芯,还有哪些,海光好像也有 |
28 cctvbnm111X1 3h 22m ago 如果现在上项目,那必须是腾 950dt ,fp8 都不错了,反正有技术支持,其他几个厂都要慢的多,如果你说自己玩,那还是 ppu ,cuda 生态容易点 |
29 whoops 3h 18m ago 有信创要求,你的选择也就这九个,你可以了解一下平头哥,据说比华为的坑少一点,https://www.itsec.gov.cn/aqkkcp/cpgg/202605/t20260526_259396.html |
30 songray 3h 13m ago 国内的卡基本都是偏科的,建议先去云服务上租不同型号,把自己的 POC 跑通。 |
31 wskymark 3h 9m ago 这东西不是只需要考虑一上指标吗?哪家有利润要哪家的 |
34 xiaomushen 2h 56m ago @Jiajin 这东西只有理论算力。。。实际极难发挥 |
35 xiaomushen 2h 54m ago @cpper 又不是你口袋里的钱,有啥浪费不浪费的。哪怕外企里买了 H100 部署,你能保证大部分情况下,不是浪费么? |
36 google2023 2h 51m ago @DeYiAo 武汉某高校去年 4000W 用在腾身上,技术支持都远远跟不上 |
37 google2023 2h 50m ago @skuuhui 麻烦推荐几家?最好有武汉的,要真正技术实力强的 |
38 xxmaqzas 2h 38m ago 我们信创项目都用的昆仑芯 P800 只能说不太好用 |
39 find 2h 29m ago via Android 看了好多评论,果然是殖人思想。难道一辈子都要受制于别人吗 |
40 codingmiao 2h 20m ago 用过海光、腾、平头哥。腾自建生态加上文档稀烂,体验就是一坨。另外两家 cuda 上能跑的代码随便改改就能跑起来,但比起 n 卡来性能和体验还是要差不少。 |
41 cpper 2h 7m ago 总有些人以为是在创新和防止卡脖子,其实背后全是利益和勾兑 |
42 cpper 2h 6m ago @xiaomushen 我每年个人所得税交几十万,还不能关心下蛀虫浪费税收了? |
43 cpper 2h 5m ago 有些人揣着明白装糊涂,信创都是些什么东西心里没点数吗 |
44 Flagship9945 OP 产品选型,不涉及其他的~~ |
45 cpper 2h 4m ago @xiaomushen 外企就是把买的卡扔到水坑里都无所谓,只要不是花的税收的钱。但信创的那些单位花的钱来自于哪里你心里没数? |
46 jacketma 1h 44m ago 网上不是爆腾 910b 、910c 都是 TSMC 代工的 7nm 么(算能科技发包),工艺品控应该可以,就看你这边部署能不能适应软件生态了 |
47 EngelEyes 1h 36m ago 七彩虹 |
48 abel533 1h 20m ago @songray #33 这两家找过多个入口,都看不到能选 GPU 的地方。。想从头在一台机器部署大模型测试,方便提供一个选择型号的入口界面吗?问过 AI ,说有,根据步骤走不通。 |
49 murmur 27 mins ago 阿里 平头哥 |
50 jokechen 27 mins ago 腾 910c 部署 deepseek 遇到了一个 bug ,直接影响使用,还是要谨慎些。 https://github.com/vllm-project/vllm-ascend/issues/9170 |