phi-2-sft-ultrachat-full开源大语言模型 - 免费部署助力对话生成

首页

Phi 2 Sft Ultrachat Full

由 lole25 开发

基于microsoft/phi-2在ultrachat_200k数据集上微调的大语言模型，适用于对话生成任务。

大型语言模型

Transformers

其他开源协议:MIT #对话微调 #小参数高效 #多轮对话优化

下载量 68

发布时间 : 3/7/2024

模型简介

本模型是基于microsoft/phi-2在HuggingFaceH4/ultrachat_200k数据集上进行监督微调(SFT)的版本，主要用于对话生成任务。

模型特点

监督微调

在ultrachat_200k数据集上进行监督微调，优化对话生成能力

多GPU训练

使用4个GPU进行分布式训练，提高训练效率

优化训练

采用余弦退火学习率调度和预热策略，优化训练过程

模型能力

文本生成

对话系统

自然语言理解

使用案例

对话系统

智能聊天机器人

可用于构建智能聊天机器人系统

训练损失	轮数	步数	验证损失
1.2491	1.0	3996	1.2346
1.1463	2.0	7993	1.1998
1.1623	3.0	11988	1.1928

属性	详情
基础模型	microsoft/phi-2
标签	alignment-handbook、generated_from_trainer、trl、sft、generated_from_trainer
数据集	HuggingFaceH4/ultrachat_200k
模型名称	phi-2-sft-ultrachat-full

精选推荐AI模型

Llama 3 Typhoon V1.5x 8b Instruct

专为泰语设计的80亿参数指令模型，性能媲美GPT-3.5-turbo，优化了应用场景、检索增强生成、受限生成和推理任务

Cadet-Tiny是一个基于SODA数据集训练的超小型对话模型，专为边缘设备推理设计，体积仅为Cosmo-3B模型的2%左右。

Roberta Base Chinese Extractive Qa

基于RoBERTa架构的中文抽取式问答模型，适用于从给定文本中提取答案的任务。

问答系统中文

uer

2,694

智启未来，您的人工智能解决方案智库

简体中文

Phi 2 Sft Ultrachat Full

模型简介

模型特点

模型能力

使用案例

🚀 phi-2-sft-ultrachat-full

🚀 快速开始

📦 安装指南

💻 使用示例

📚 详细文档

模型描述

预期用途与限制

训练和评估数据

训练过程

训练超参数

训练结果

框架版本

📄 许可证

📋 模型信息