Llama3-Chinese-8B-Instruct-Agent-v1开源模型 - 适配中文场景支持智能体调用

首页

Llama3 Chinese 8B Instruct Agent V1

由 modelscope 开发

基于Llama3-8b-instruct基础模型训练，适配中文通用场景，支持ReACT格式的智能体调用

大型语言模型

Transformers

#中文智能体 #ReACT格式支持 #多源语料训练

下载量 17

发布时间 : 4/23/2024

模型简介

本模型针对中文场景优化，支持智能体交互，适用于多种自然语言处理任务

模型特点

中文场景优化

针对中文互联网内容进行专门训练，包含中国传统知识、豆瓣、知乎等多种中文语料

智能体支持

支持ReACT格式的智能体调用，可与ModelScopeAgent框架协同使用

多源训练数据

融合COIG-CQIA、魔搭智能体训练集、alpaca英文数据集和ms-bench中文问答集等多种数据源

高效微调

采用LoRA技术进行高效微调，保持模型性能的同时降低训练成本

模型能力

中文文本生成

智能体交互

问答系统

知识推理

使用案例

智能客服

中文问答系统

构建基于知识的中文问答系统

教育辅助

传统知识问答

回答与中国传统文化相关的问题

互联网应用

社区内容生成

生成适合豆瓣、知乎等平台的内容

🚀 魔搭Llama3 8b中文Agent智能体模型

本模型使用Llama3 - 8b - instruct基模型进行训练，适配中文通用场景，且支持ReACT格式的Agent调用，为中文自然语言处理提供了强大支持。

🚀 快速开始

模型使用

推理

# 安装依赖
pip install ms-swift -U

# 推理
swift infer --model_type llama3-8b-instruct --model_id_or_path swift/Llama3-Chinese-8B-Instruct-Agent-v1

# 部署
swift deploy --model_type llama3-8b-instruct --model_id_or_path swift/Llama3-Chinese-8B-Instruct-Agent-v1

本模型可以联合ModelScopeAgent框架使用，请参考： ModelScopeAgent使用文档

✨ 主要特性

框架支持：基于Pytorch框架构建。
许可证：使用Llama3许可证。
任务类型：支持文本生成任务。

📦 安装指南

在推理部分已包含安装依赖的命令：

pip install ms-swift -U

📚 详细文档

模型训练信息

为了适配中文及Agent场景，我们针对语料进行了一定混合配比，训练Llama3使用的语料如下：

COIG - CQIA：该数据集包含了中国传统知识、豆瓣、弱智吧、知乎等中文互联网信息
魔搭通用Agent训练数据集: 数据集链接
alpaca - en: 数据集链接
ms - bench魔搭通用中文问答数据集: 数据集链接

属性	详情
模型类型	Llama3
训练数据	COIG - CQIA、魔搭通用Agent训练数据集、alpaca - en、ms - bench魔搭通用中文问答数据集

训练使用的超参数如下：

超参数	值
lr	5e - 5
epoch	2
lora_rank	8
lora_alpha	32
lora_target_modules	ALL
batch_size	2
gradient_accumulation_steps	16

模型训练命令

NPROC_PER_NODE=8 \
swift sft \
  --model_type llama3-8b-instruct \
  --dataset ms-agent-for-agentfabric-default alpaca-en ms-bench ms-agent-for-agentfabric-addition coig-cqia-ruozhiba coig-cqia-zhihu coig-cqia-exam coig-cqia-chinese-traditional coig-cqia-logi-qa coig-cqia-segmentfault coig-cqia-wiki \
  --batch_size 2 \
  --max_length 2048 \
  --use_loss_scale true \
  --gradient_accumulation_steps 16 \
  --learning_rate 5e-5 \
  --use_flash_attn true \
  --eval_steps 500 \
  --save_steps 500 \
  --train_dataset_sample -1 \
  --dataset_test_ratio 0.1 \
  --val_dataset_sample 10000 \
  --num_train_epochs 2 \
  --check_dataset_strategy none \
  --gradient_checkpointing true \
  --weight_decay 0.01 \
  --warmup_ratio 0.03 \
  --save_total_limit 2 \
  --logging_steps 10 \
  --sft_type lora \
  --lora_target_modules ALL \
  --lora_rank 8 \
  --lora_alpha 32