S

Stablelm Zephyr 3b GGUF

由 brittlewis12 开发
StableLM Zephyr 3B是一个30亿参数的指令调优模型,基于公开数据集、合成数据集和直接偏好优化(DPO)训练,性能表现优异。
下载量 51
发布时间 : 4/25/2025
模型介绍
内容详情
替代品

模型简介

这是一个30亿参数的因果语言模型,专门针对指令任务进行了优化,适用于文本生成和对话任务。

模型特点

指令调优优化
模型经过专门的指令调优训练,能够更好地理解和执行用户指令
直接偏好优化(DPO)
采用直接偏好优化方法训练,提高了模型输出的质量和相关性
多数据集训练
基于多个高质量数据集训练,包括ultrachat_200k、ultrafeedback_binarized等
GGUF格式支持
提供GGUF格式模型文件,便于在各种设备上运行

模型能力

文本生成
对话系统
指令理解与执行
内容创作

使用案例

对话系统
智能助手
可作为智能对话助手使用
在AlpacaEval评估中获得76%胜率
内容创作
文本生成
可用于生成各种类型的文本内容