C

Causallm 14B DPO Alpha GGUF

由 tastypear 开发
基于14B参数的因果语言模型,经过DPO优化训练,支持中英文文本生成任务
下载量 2,238
发布时间 : 11/25/2023
模型介绍
内容详情
替代品

模型简介

这是一个经过直接偏好优化(DPO)训练的14B参数因果语言模型,专为文本生成任务设计,支持中英文双语处理。模型在MT-Bench基准测试中表现优异,接近GPT-3.5水平。

模型特点

DPO优化训练
采用直接偏好优化方法训练,使模型输出更符合人类偏好
双语支持
同时支持英文和中文文本生成任务
高性能表现
在MT-Bench基准测试中得分7.618868,接近GPT-3.5水平
GGUF格式支持
提供GGUF格式模型文件,兼容多种推理客户端和库

模型能力

文本生成
对话系统
问答系统
内容创作

使用案例

智能对话
聊天机器人
构建中英文双语聊天机器人
接近GPT-3.5水平的对话体验
内容创作
文章生成
根据提示生成中英文文章