使用llamafactory对模型进行微调

发布于：2025-08-30 ⋅ 阅读:(97) ⋅ 点赞:(0)

准备

安装llamafactory

强烈建议在linux系统上安装，windows上对pytorch支持不是很好
下载源码

git clone https://github.com/hiyouga/LLaMA-Factory.git

安装依赖

可以根据个人需要创建虚拟环境

pip install -r requirements.txt

启动客户端

llamafactory-cli webui

客户端如果能正常启动，且可以访问http://ip:7860/，说明安装成功

选取基础模型

根据训练的目的和使用场景选择基础模型
我这里选择的是qwen3：14b

准备训练数据

我打算训练一个直播弹幕回复的模型，于是我收集了特定领域主播对弹幕回复的内容，然后整理成指定的格式

[
 {
  "instruction": "你叫抖音白酒带货主播，语气亲切、有节奏；必须合规、真实、不过度承诺。",
  "input": "这个52度的酒12瓶只要109.99，67度的148.99，直播间里的价格真的靠谱吗？",
  "output": "便宜吧老板,52度的到手12瓶,今天只需要109.9967度的到手12瓶,今天只需要148.99,我的天老板这个价格太便宜了,low到底了,快递费我都挣不回,我给你发的呢是12瓶,加量不加价,你算算咱直播间这账啊,42度的合下来一瓶8块多,52度合下来一瓶9块多,你对比一下原价一瓶差了30块钱。"
 }...
 ]

注册数据集

把数据集放到llamafactory目录的data位置
修改data目录下dataset_info.json文件，把准备好的文件信息追加进去

"live_script":{ # 训练集名，只要不与其他的名称重复就行
    "file_name":"live_script.json" # 数据集文件名
  }

开始训练

打开webui页面(http://ip:7860/)

在这里插入图片描述
按照上面配置即可
验证比例我但是设置的是0.15,对于小训练集1000左右的数据量，验证集设置为100以上即可，其他内容可以适当调整，具体根据训练结果进行调整。现在默认的配置是通用配置

点击开始即可
训练好的结果将放过在saves目录下注意查看

效果验证

训练完成后，可以通过加载检查点然后chat对话查看训练结果
在这里插入图片描述

如果发现训练的结果不理想，可以重新调整参数进行训练

详细说明见 https://www.bilibili.com/video/BV1djgRzxEts?vd_source=5c3b83d1d90b9e3b9f0107b2173d291f&spm_id_from=333.788.videopod.sections&p=6

使用llamafactory对模型进行微调

准备

安装llamafactory

启动客户端

选取基础模型

准备训练数据

注册数据集

开始训练

打开webui页面(http://ip:7860/)

效果验证

如果发现训练的结果不理想，可以重新调整参数进行训练

微信公众号

今日签到

热门文章

最新发布