LLaMa-Factory命令大全

半兽人 发表于: 2025-05-28   最后更新时间: 2025-06-24 16:09:32  
{{totalSubscript}} 订阅, 30 游览

llamafactory-cli 命令行工具接口,它是 LLaMA-Factory v3 版本引入的新特性,用于简化常用操作(训练、推理、导出等)。下面是 llamafactory-cli 的命令大全 和每个子命令的说明:

命令总览:llamafactory-cli 命令大全

llamafactory-cli [command] [options]

常用主命令:

命令 说明
env 显示环境信息(PyTorch、CUDA、transformers 等)
train 启动模型训练(封装了 src/train_bash.py
merge 合并 LoRA 模型权重为 HuggingFace 模型
cli 启动命令行交互测试
webui 启动 Web UI 推理界面
export 导出模型为 GGUF 或 Safetensors
convert 转换数据格式为标准训练集
validate 验证数据集格式是否正确
chat 在命令行中与模型多轮对话
clean 清理缓存、训练中间结果
build 构建 tokenizer/config 结构

详细命令说明

1. 查看环境信息

# llamafactory-cli env

- `llamafactory` version: 0.9.3.dev0
- Platform: Linux-5.15.0-131-generic-x86_64-with-glibc2.39
- Python version: 3.12.3
- PyTorch version: 2.6.0a0+df5bbc09d1.nv24.12 (GPU)
- Transformers version: 4.51.3
- Datasets version: 3.5.0
- Accelerate version: 1.6.0
- PEFT version: 0.15.1
- TRL version: 0.9.6
- GPU type: NVIDIA GeForce RTX 3080
- GPU number: 2
- GPU memory: 9.68GB

输出当前环境状态:PyTorch 版本、CUDA、transformers、peft 等依赖库信息。

2. 启动训练任务

llamafactory-cli train --config ./configs/sft.yaml

使用 YAML 配置文件进行训练(更规范的方式)。

3. 命令行对话

llamafactory-cli cli --model_name_or_path path_to_model

使用你训练好的模型进行命令行聊天。

4. 启动 Web UI

llamafactory-cli web --model_name_or_path path_to_model --share

用浏览器打开图形界面测试模型,可以选择 --share 开公网链接。

5. 合并 LoRA 模型

llamafactory-cli merge \
  --base_model base_model_path \
  --lora_model lora_adapter_path \
  --output_dir merged_model_path

6. 导出为 GGUF(用于 llama.cpp)

llamafactory-cli export \
  --model_name_or_path merged_model_path \
  --format gguf \
  --quantization q4_0 \
  --output_dir ./gguf_model

7. 数据集转换为 Alpaca / ChatML 等格式

llamafactory-cli convert \
  --input_file ./data/raw.json \
  --output_file ./data/converted.json \
  --format alpaca

8. 验证数据格式是否正确

llamafactory-cli validate \
  --input_file ./data/converted.json

9. 多轮对话测试(Chat 模式)

llamafactory-cli chat --model_name_or_path path_to_model

10. 清理缓存或输出路径

llamafactory-cli clean

11. 构建 tokenizer 和 config(高级用法)

llamafactory-cli build --model_type llama --output_dir ./model

查看完整帮助

llamafactory-cli --help         # 总帮助
llamafactory-cli train --help   # 某个命令的详细参数说明

小结

类型 示例
查看环境 llamafactory-cli env
训练模型 llamafactory-cli train --config xxx.yaml
推理测试 llamafactory-cli cli / web / chat
合并模型 llamafactory-cli merge
导出模型 llamafactory-cli export --format gguf
数据工具 convert, validate
清理缓存 llamafactory-cli clean
更新于 2025-06-24
在线,6小时前登录

查看LLaMA-Factory更多相关的文章或提一个关于LLaMA-Factory的问题,也可以与我们一起分享文章