L

Llama DNA 1.0 8B Instruct

由 dnotitia 开发
基于Llama架构的最先进双语语言模型,特别优化了韩语理解和生成能力,同时保持强大的英语能力。
下载量 661
发布时间 : 12/6/2024
模型介绍
内容详情
替代品

模型简介

DNA 1.0 8B 指导模型是通过复杂的模型合并过程开发的,包括与Llama 3.1 8B指导模型进行球面线性插值(SLERP),并使用Llama 3.1 405B作为教师模型进行知识蒸馏(KD)。通过高质量韩语数据集的持续预训练(CPT)进行了广泛训练,并通过监督微调(SFT)和直接偏好优化(DPO)完成训练流程。

模型特点

优化的韩语能力
特别针对韩语理解和生成进行了优化,同时保持强大的英语能力。
先进的训练方法
采用球面线性插值(SLERP)、知识蒸馏(KD)、持续预训练(CPT)、监督微调(SFT)和直接偏好优化(DPO)等多种先进训练技术。
长上下文支持
支持131,072标记(128k)的长上下文处理能力。
人类偏好对齐
通过直接偏好优化(DPO)训练流程,使模型输出更符合人类偏好。

模型能力

韩语文本生成
英语文本生成
多轮对话
复杂指令理解
知识问答

使用案例

智能助手
韩语聊天机器人
用于韩语环境的智能对话助手
在KMMLU和KoBEST等韩语基准测试中表现优异
教育
语言学习助手
帮助学习者练习韩语和英语
商业应用
双语客服系统
用于处理韩语和英语客户咨询