深度学习为什么很少提了,普通开发有转大模型的可能吗 - V2EX
V2EX = way to explore
V2EX 是一个关于分享和探索的地方
现在注册
已注册用户请  登录
devzhaoyou
V2EX    职场话题

深度学习为什么很少提了,普通开发有转大模型的可能吗

  •  
  •   devzhaoyou 11 小时 18 分钟前 2319 次点击

    个人做的普通客户端开发,也了解点服务端开发,之前还学习过深度学习,之前还想转深度学习开发,买张卡还能训练调试下。但是现在的趋势是大模型火,感觉深度学习很少有人提了,都在搞大模型。

    但是对于普通的开发想转大模型,是搞开发呢还是搞应用,而且大模型训练 N 张卡,也不是普通人能调试测试的呀, 这块不是很了解。所以普通开发,如果没有公司提供资源,基本接触不大大模型开发吗?

    现在觉的只做传统的开发感觉没有出路了,所以请教各位,如果转的话什么方向比较好

    20 条回复    2026-04-10 19:13:58 +08:00
    sentinelK
        1
    sentinelK  
       10 小时 44 分钟前   1
    “普通开发有转大模型的可能吗” 不可能。
    再加上你的问题,更加确定了不可能。

    机器学习是算法学和计算机科学。软件开发是工程学,除了都要摸键盘以外,没半点关系。

    这就像是,一个工地的搬砖工,发现卡车比他搬得快,问:搬砖感觉没有出炉了,我现在想转业界顶流建筑师,怎么做比较好?搞办公楼还是公寓楼方向?
    jiangxiaoshui
        2
    jiangxiaoshui  
       10 小时 33 分钟前
    现在做毛大模型啊,做大模型的应用不是发展前景更好吗?
    yuedashi
        3
    yuedashi  
       10 小时 25 分钟前 via Android
    @sentinelK 你都没 get 到人家的点。我一律师,想转行程序员,是完全可以啊,一些书,一台电脑就够实操了。人家的意思是,大模型你学了理论后,没训练卡,实操怎么弄?
    importmeta
        4
    importmeta  
       10 小时 23 分钟前
    找一些研究生问问,在各个平台发帖问问。估计他们算力也不够。目前前沿还是在国外,我上次刷到一些帖子,在国外上学的那些人,实验室 H200 管够。
    tina2998
        5
    tina2998  
       10 小时 20 分钟前 via iPhone
    我记得前几年看到有个外国老哥,也是对 llm 感兴趣,于是去读了个 master,回来说毛用没有一样只能做做应用。llm 是一大帮科学家在后面支持的,普通人就算了吧
    herozzm
        6
    herozzm  
       10 小时 19 分钟前
    深度学习是人工智能 AI 前期用的词语,属于过渡词
    NoobNoob030
        7
    NoobNoob030  
       9 小时 1 分钟前
    并非很少提,机器学习(学科)->深度学习(分支)->神经网络(架构)->transformer (算法)->大模型(产出)

    普通人做大模型应用可以,想做算法开发门槛高学习曲线陡峭,没有赛博天灵根不建议尝试
    sentinelK
        8
    sentinelK  
       8 小时 56 分钟前   3
    @yuedashi 你也没 get 到我的点。

    1 、律师能跨到程序员,不等于程序员能跨到大模型研究员。同理,你是律师你为何跨到程序员,而不跨到最高院?

    2 、想研究统计学模型,“脑补”会卡在算力,就说明他压根就没上手。

    3 、目前的 AI 都是基于机器学习的统计学模型。LLM 只是其中的一个分支,深度学习、神经网络也一样。他们目前都需要配合无监督,或者说弱监督的强化学习,LLM 早就不是纯语料机器学习的时代了。

    综上,说明他的问题实际是基于 0 实践、0 基础的纯空想。所以不可能。
    newtype0092
        9
    newtype0092  
       8 小时 20 分钟前   1
    智能手机这个词也很少提了,很多人只知道 Android 和 iOS 。。。

    LLM 本质上还是深度学习,只是参数量大而已。

    你要真想搞模型相关而不是应用,起码读个博士再说。否则就好好抓热点搞应用层,搭上这波顺风车其实也是个不错的机会。
    fredweili
        10
    fredweili  
       8 小时 19 分钟前
    你不用想了,不是顶尖大学的博士,转了模型训练也干不了啥
    普通人就是学怎么用好 claude code
    whoosy
        11
    whoosy  
       8 小时 18 分钟前
    LLM 不也是深度学习下的分支?
    wengjin456123
        12
    wengjin456123  
       8 小时 14 分钟前
    大模型也是深度学习,如果要搞深度学习类的工作,看你背景是客户端开发,不知道有没有硕士学位和 paper ,有的话可以先去 RA 攒点资历然后 phd ,这是比较稳妥的方式,公司就那几个,走实习/校招/社招你最起码都得有个对应的硕博经历,所以又转回去了。
    gam2046
        13
    gam2046  
       7 小时 56 分钟前
    几乎不可能转,专业壁垒极高,脱产学三年,大部分人也没戏,尤其是数学基础,这个东西和计算机的关系反而没那么大。基础模型的迭代,基本上就靠科学家,而不是程序员。哪怕是模型微调,也不是一半程序员能干的。

    落到计算机领域里,更多的是应用方向了,比如 AI Agent ,就更多的展示了,对于大模型的应用,编排等,比如像 openclaw 这样的工具,就是具体应用的工具,他本身并不依赖于特定的大模型。又比如像 DroidRun 这种垂类的 agent 编排。

    再下游,就是做具体工作流的,比如各种自媒体吹嘘的,“三天打造一个数字分身”这种,本质上就是在编排好的 agent 上,进一步做任务特化,聚焦到某个精细的点上。
    JoeDH
    &nsp;   14
    JoeDH  
       7 小时 16 分钟前
    985 硕博+相关专业才有可能,其他就别想了
    Suger828
        15
    Suger828  
       6 小时 48 分钟前
    基本别想了
    lance07
        16
    lance07  
       5 小时 52 分钟前
    何意味,现在 92 的 nlp 组普通硕士都难去大模型
    Eathein
        17
    Eathein  
       5 小时 15 分钟前
    搞大模型更像是搞数学吧..
    stoneabc
        18
    stoneabc  
       5 小时 7 分钟前
    我觉得楼上说的太绝对了。
    大模型相关开发,涉及的可太广了,从纯粹的模型算法开发,到 LLM 训推框架层开发( vLLM 这类),再到训推系统开发(偏集群管理、任务调度、快恢等),再到应用层( Agent 等)等等,如果你毫无经验的话,算法开发确实不用想了,但后面几种,还是可以搞一搞的,门槛没想象中那么大。
    kpprotector
        19
    kpprotector  
       4 小时 27 分钟前
    你没有数据啊,朋友,卡和机器都可以租,但是数据你怎么搞定?
    过去 Kaggle 上一个机器学习项目十几 KB 深度学习几百 GB 到头了。

    Pre-train Post-train 基本上都是十几 T token 的语料,更不用说数据清洗了。
    如果没那个条件,能在有限的数据里做做微调、Agent 就很不错了。

    其实微调的意义也不好评价,去年我们画了几千块微调了一个内容审核模型,效果勉强能用。
    俩月之后 Qwen-Guard 出了……
    sadfasdfa
        20
    sadfasdfa  
       3 小时 25 分钟前 via iPhone
    先学会用吧,现在 AI 大模型已经层出不穷了,用 AI 都用不完
    关于     帮助文档     自助推广系统     博客     API     FAQ     Solana     2747 人在线   最高记录 6679       Select Language
    创意工作者们的社区
    World is powered by solitude
    VERSION: 3.9.8.5 20ms UTC 14:39 PVG 22:39 LAX 07:39 JFK 10:39
    Do have faith in what you're doing.
    ubao msn snddm index pchome yahoo rakuten mypaper meadowduck bidyahoo youbao zxmzxm asda bnvcg cvbfg dfscv mmhjk xxddc yybgb zznbn ccubao uaitu acv GXCV ET GDG YH FG BCVB FJFH CBRE CBC GDG ET54 WRWR RWER WREW WRWER RWER SDG EW SF DSFSF fbbs ubao fhd dfg ewr dg df ewwr ewwr et ruyut utut dfg fgd gdfgt etg dfgt dfgd ert4 gd fgg wr 235 wer3 we vsdf sdf gdf ert xcv sdf rwer hfd dfg cvb rwf afb dfh jgh bmn lgh rty gfds cxv xcv xcs vdas fdf fgd cv sdf tert sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf shasha9178 shasha9178 shasha9178 shasha9178 shasha9178 liflif2 liflif2 liflif2 liflif2 liflif2 liblib3 liblib3 liblib3 liblib3 liblib3 zhazha444 zhazha444 zhazha444 zhazha444 zhazha444 dende5 dende denden denden2 denden21 fenfen9 fenf619 fen619 fenfe9 fe619 sdf sdf sdf sdf sdf zhazh90 zhazh0 zhaa50 zha90 zh590 zho zhoz zhozh zhozho zhozho2 lislis lls95 lili95 lils5 liss9 sdf0ty987 sdft876 sdft9876 sdf09876 sd0t9876 sdf0ty98 sdf0976 sdf0ty986 sdf0ty96 sdf0t76 sdf0876 df0ty98 sf0t876 sd0ty76 sdy76 sdf76 sdf0t76 sdf0ty9 sdf0ty98 sdf0ty987 sdf0ty98 sdf6676 sdf876 sd876 sd876 sdf6 sdf6 sdf9876 sdf0t sdf06 sdf0ty9776 sdf0ty9776 sdf0ty76 sdf8876 sdf0t sd6 sdf06 s688876 sd688 sdf86