构造大模型微调数据集 - V2EX
V2EX = way to explore
V2EX 是一个关于分享和探索的地方
现在注册
已注册用户请  登录
请不要在回答技术问题时复制粘贴 AI 生成的内容
mumu157
V2EX    程序员

构造大模型微调数据集

  •  
  •   mumu157 2025 年 5 月 7 日 1821 次点击
    这是一个创建于 250 天前的主题,其中的信息可能已经有所发展或是发生改变。

    现在大模型 LLM 微调框架遍地开花,开源数据集也很多,麻烦的是用私有数据构造数据集,写了一个简单的项目,供参考。能帮忙点点 star 就更好啦 FastDatasets FastDatasets FastDatasets

    6 条回复    2025-05-09 16:54:00 +08:00
    Dreamerwwr
        1
    Dreamerwwr  
       2025 年 5 月 8 日
    已 star ,目前什么领域需要微调自己的数据?打模型能力变强,微调是否有意义?微调相当于把模型给固化了,反而可能降低模型能力。
    在模型能力强的前提下,我们优化提示词就能达到效果吧
    mumu157
        2
    mumu157  
    OP
       2025 年 5 月 8 日
    @Dreamerwwr 有很多方面吧,我举几个例子
    1. 原始模型不包含一些私域的信息,比如一些财务、法律、金融信息
    2.需要模型强化某些领域的专业能力
    3.强化输出能力,需要按照某些格式进行输出
    4.想要洗掉原始模型的数据或者自我认知、以及其他一些合规性要求之类的
    5.强化模型能力,比如通过 R1 蒸馏数据微调一些 llama 、qwen 之类的小模型
    应用还是比较多的
    uni
        3
    uni  
       2025 年 5 月 9 日
    已 star
    我们现在遇到的一个需求是微调出来的泛化性不够,目前我们的解决办法是使用别的大模型扩充原有的训练数据(比如说同一个问题换多种提问方式等等),跟蒸馏有点像,实测效果还不错的,如果 op 的框架能加入这个功能就更好啦
    mumu157
        4
    mumu157  
    OP
       2025 年 5 月 9 日
    @uni 可以提个 issue ,最近有空可以完善一下哈
    cbb903601682504
        5
    cbb903601682504  
       2025 年 5 月 9 日
    推荐一个类似的工具 Easy Dataset: https://github.com/ConardLi/easy-dataset 感觉功能是一样的
    Dreamerwwr
        6
    Dreamerwwr  
       2025 年 5 月 9 日
    我觉得可以搞一个场景案例来拓展思考,根据场景案例出一套详细的微调、验证教程,这样也可以宣传项目
    关于     帮助文档     自助推广系统     博客     API     FAQ     Solana     5364 人在线   最高记录 6679       Select Language
    创意工作者们的社区
    World is powered by solitude
    VERSION: 3.9.8.5 22ms UTC 07:02 PVG 15:02 LAX 23:02 JFK 02:02
    Do have faith in what you're doing.
    ubao msn snddm index pchome yahoo rakuten mypaper meadowduck bidyahoo youbao zxmzxm asda bnvcg cvbfg dfscv mmhjk xxddc yybgb zznbn ccubao uaitu acv GXCV ET GDG YH FG BCVB FJFH CBRE CBC GDG ET54 WRWR RWER WREW WRWER RWER SDG EW SF DSFSF fbbs ubao fhd dfg ewr dg df ewwr ewwr et ruyut utut dfg fgd gdfgt etg dfgt dfgd ert4 gd fgg wr 235 wer3 we vsdf sdf gdf ert xcv sdf rwer hfd dfg cvb rwf afb dfh jgh bmn lgh rty gfds cxv xcv xcs vdas fdf fgd cv sdf tert sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf shasha9178 shasha9178 shasha9178 shasha9178 shasha9178 liflif2 liflif2 liflif2 liflif2 liflif2 liblib3 liblib3 liblib3 liblib3 liblib3 zhazha444 zhazha444 zhazha444 zhazha444 zhazha444 dende5 dende denden denden2 denden21 fenfen9 fenf619 fen619 fenfe9 fe619 sdf sdf sdf sdf sdf zhazh90 zhazh0 zhaa50 zha90 zh590 zho zhoz zhozh zhozho zhozho2 lislis lls95 lili95 lils5 liss9 sdf0ty987 sdft876 sdft9876 sdf09876 sd0t9876 sdf0ty98 sdf0976 sdf0ty986 sdf0ty96 sdf0t76 sdf0876 df0ty98 sf0t876 sd0ty76 sdy76 sdf76 sdf0t76 sdf0ty9 sdf0ty98 sdf0ty987 sdf0ty98 sdf6676 sdf876 sd876 sd876 sdf6 sdf6 sdf9876 sdf0t sdf06 sdf0ty9776 sdf0ty9776 sdf0ty76 sdf8876 sdf0t sd6 sdf06 s688876 sd688 sdf86