L

Llama 3 Gutenberg 8B

由 nbeerbower 开发
基于Llama-3-8b的微调模型,使用Gutenberg DPO数据集进行优化,适用于文本生成任务。
下载量 18
发布时间 : 5/5/2024
模型介绍
内容详情
替代品

模型简介

该模型是基于Llama-3-8b架构的文本生成模型,通过DPO(Direct Preference Optimization)方法在Gutenberg数据集上进行微调,旨在提升指令遵循和文本生成能力。

模型特点

DPO微调优化
使用Direct Preference Optimization方法在Gutenberg数据集上进行微调,提升模型对指令的遵循能力。
LoRA高效训练
采用LoRA(Low-Rank Adaptation)技术进行高效微调,减少计算资源需求。
多任务评估
在多个基准测试(IFEval、BBH、MATH等)上进行评估,展示多样化文本生成能力。

模型能力

文本生成
指令遵循
多轮对话

使用案例

教育
教学问答系统
用于构建教育领域的问答系统,回答学生问题。
在MMLU-PRO测试中达到31.45%准确率
内容创作
创意写作辅助
辅助作家进行创意写作和内容生成。