LLaMa-Factory命令大全

llamafactory-cli 命令行工具接口，它是 LLaMA-Factory v3 版本引入的新特性，用于简化常用操作（训练、推理、导出等）。下面是 llamafactory-cli 的命令大全 和每个子命令的说明：

命令总览：`llamafactory-cli` 命令大全

llamafactory-cli [command] [options]

常用主命令：

命令	说明
`env`	显示环境信息（PyTorch、CUDA、transformers 等）
`train`	启动模型训练（封装了 `src/train_bash.py`）
`merge`	合并 LoRA 模型权重为 HuggingFace 模型
`cli`	启动命令行交互测试
`webui`	启动 Web UI 推理界面
`export`	导出模型为 GGUF 或 Safetensors
`convert`	转换数据格式为标准训练集
`validate`	验证数据集格式是否正确
`chat`	在命令行中与模型多轮对话
`clean`	清理缓存、训练中间结果
`build`	构建 tokenizer/config 结构

详细命令说明

1. 查看环境信息

# llamafactory-cli env

- `llamafactory` version: 0.9.3.dev0
- Platform: Linux-5.15.0-131-generic-x86_64-with-glibc2.39
- Python version: 3.12.3
- PyTorch version: 2.6.0a0+df5bbc09d1.nv24.12 (GPU)
- Transformers version: 4.51.3
- Datasets version: 3.5.0
- Accelerate version: 1.6.0
- PEFT version: 0.15.1
- TRL version: 0.9.6
- GPU type: NVIDIA GeForce RTX 3080
- GPU number: 2
- GPU memory: 9.68GB

输出当前环境状态：PyTorch 版本、CUDA、transformers、peft 等依赖库信息。

2. 启动训练任务

llamafactory-cli train --config ./configs/sft.yaml

使用 YAML 配置文件进行训练（更规范的方式）。

3. 命令行对话

llamafactory-cli cli --model_name_or_path path_to_model

使用你训练好的模型进行命令行聊天。

4. 启动 Web UI

llamafactory-cli web --model_name_or_path path_to_model --share

用浏览器打开图形界面测试模型，可以选择 --share 开公网链接。

5. 合并 LoRA 模型

llamafactory-cli merge \
  --base_model base_model_path \
  --lora_model lora_adapter_path \
  --output_dir merged_model_path

6. 导出为 GGUF（用于 llama.cpp）

llamafactory-cli export \
  --model_name_or_path merged_model_path \
  --format gguf \
  --quantization q4_0 \
  --output_dir ./gguf_model

7. 数据集转换为 Alpaca / ChatML 等格式

llamafactory-cli convert \
  --input_file ./data/raw.json \
  --output_file ./data/converted.json \
  --format alpaca

8. 验证数据格式是否正确

llamafactory-cli validate \
  --input_file ./data/converted.json

9. 多轮对话测试（Chat 模式）

llamafactory-cli chat --model_name_or_path path_to_model

10. 清理缓存或输出路径

llamafactory-cli clean

11. 构建 tokenizer 和 config（高级用法）

llamafactory-cli build --model_type llama --output_dir ./model

查看完整帮助

llamafactory-cli --help         # 总帮助
llamafactory-cli train --help   # 某个命令的详细参数说明

小结

类型	示例
查看环境	`llamafactory-cli env`
训练模型	`llamafactory-cli train --config xxx.yaml`
推理测试	`llamafactory-cli cli` / `web` / `chat`
合并模型	`llamafactory-cli merge`
导出模型	`llamafactory-cli export --format gguf`
数据工具	`convert`, `validate`
清理缓存	`llamafactory-cli clean`