C

Causallm 7B DPO Alpha GGUF

由 tastypear 开发
基于Llama 2架构的7B参数大语言模型,经过DPO训练优化,支持中英文文本生成
下载量 367
发布时间 : 11/19/2023
模型介绍
内容详情
替代品

模型简介

这是一个经过DPO优化的7B参数大语言模型,基于Llama 2架构,支持中英文文本生成任务。模型在多个数据集上训练,包括Guanaco、OpenOrca等,旨在提供更符合人类偏好的文本生成能力。

模型特点

DPO优化
模型经过直接偏好优化(DPO)训练,能生成更符合人类偏好的文本
多数据集训练
在Guanaco、OpenOrca、UltraChat等20多个高质量数据集上训练
中英双语支持
同时支持英文和中文文本生成任务
GGUF量化格式
提供多种量化版本的GGUF格式模型文件,便于不同硬件部署

模型能力

文本生成
对话系统
问答系统
内容创作

使用案例

对话系统
智能助手
可用于构建智能对话助手
在MT-Bench基准测试中得分7.038
内容创作
文本生成
可用于生成各种类型的文本内容