W

Westlake 7B V2 Laser Truthy Dpo

由 macadeliccc 开发
基于WestLake-7B-v2-laser模型在truthy-dpo-v0.1数据集上进行微调的大语言模型,专注于文本生成任务,在多项基准测试中表现优异。
下载量 9,693
发布时间 : 1/27/2024
模型介绍
内容详情
替代品

模型简介

这是一个7B参数规模的大语言模型,经过DPO(Direct Preference Optimization)微调,擅长生成高质量文本响应。模型在AI2推理挑战赛、HellaSwag等多个基准测试中取得良好成绩。

模型特点

DPO微调优化
使用truthy-dpo-v0.1数据集进行直接偏好优化训练,提升了模型生成质量
多基准测试表现优异
在AI2推理挑战赛、HellaSwag等多个标准测试中取得高于平均水平的成绩
多格式支持
支持ChatML和原始Mistral对话模板格式,适应不同应用场景

模型能力

文本生成
多轮对话
指令跟随
知识问答

使用案例

对话系统
智能客服
用于构建能够理解用户需求并提供有用响应的客服系统
能生成礼貌且有帮助的响应
教育辅助
学习助手
帮助学生解答问题和解释概念
在MMLU测试中达到64.84%准确率