学习大模型的显卡怎么选型

V2EX = way to explore

V2EX 是一个关于分享和探索的地方

已注册用户请登录

这是一个创建于 205 天前的主题，其中的信息可能已经有所发展或是发生改变。

想高性价比的配一个主机进行大模型的学习，预算不超过 2 万，能够进行大模型的训练和推理，自己研究了一下，有两套方案，请大家帮拿拿注意。

方案一：一张 5070Ti ，显存 16G ，估计只能训练一些 3B 、4B 的小参数模型
方案二：两张 5060Ti 的显卡，显存可以达到 32G ，可以训练一些 7B 、8B 的模型，但是单张计算性能只有 5070Ti 的一半。

之前在公司用 A800 和 3090 做过训练，感觉性能还行，5070Ti 能更接近 3090 ，不知道到有没有用 5060Ti 做过训练的朋友，5060Ti 的性能是不是太低了，如果性能太低，光显存大是不是也没多少用。或者大家没有更好的方案。

显卡选型

性价比

大模型训练

30 条回复 2025-06-03 15:21:44 +08:00

cpstar

205 天前

就 16G 显存还训练？？一张 3090 的 24G 完全秒杀，省 xing 省 xing 吧。
就 5060 还双卡？？没有 nvlink ，就靠 pcie 那点带宽，省 xing 省 xing 吧。

cuteshell

205 天前

@cpstar 之前在公司用 8 卡的 A800 ，也是 PCIe ，多卡训练时感觉还是可以的

nomagick

205 天前

16G 3B 4B 你也训不了，不过学习嘛，0.5B 还是可以的；
话说回来，LLM 这种应用，主要吃带宽，还不如买 mac 了，内存即显存

crackidz

205 天前

租卡可好？

lovestudykid

205 天前

@nomagick "主要吃带宽"，"还不如买 mac"，你是怎么把这两句话连在一起的

testcgd

205 天前 via Android

训练直接租 autodl 吧，本地优先考虑推理和 debug ，5060x2 会好一点

cuteshell

205 天前

@nomagick 之前用 24G 的训练过 Qwen 7B ，不过输入的 token 不能太多，16B 训练 4B 模型，按比例算可能是可以的，不过确实没有试过。

cuteshell

205 天前

@crackidz 租过阿里的试过，不用的时候停机，再启动记得好像有点问题，我再试试

cuteshell

205 天前

@testcgd 好的，多谢

2ruowqe9r

205 天前

模型训练，我感觉数据整理好麻烦，OP 是怎么解决的？

coefu

205 天前

4*2080ti 22g.

cuteshell

205 天前

@2ruowqe9r 之前是人工整理的，还有让用户参与收集，自己写脚本再整理一下。看还有 easydataset 什么的，不过还没用过

nomagick

205 天前

@lovestudykid 嗯？

20s PCIE3.0 x16 ~32GB/s
30s 40s PCIE4.0 x16 ~64GB/s
50s PCIE5.0 x16 ~128GB/s

Mac Mini M4 120GB/s
Mac Mini M4 Pro 273GB/s
Mac Studio M4 Max 410GB/s
Mac Studio M3 Ultra 819GB/s

nomagick

205 天前

@cuteshell LoRA 微调和全参数训练还是不一样的