Kanana是由Kakao开发的双语大语言模型系列,在韩语任务上表现卓越,同时在英语任务上保持竞争力。2.1b版本是该系列的轻量级基础模型。
下载量 4,039
发布时间 : 2/26/2025
模型介绍
内容详情
替代品
模型简介
Kanana-Nano-2.1b是一个21亿参数的双语(英文/韩文)基础语言模型,采用高效训练技术,在保持较小规模的同时提供良好的多任务处理能力。
模型特点
高效双语能力
在韩语任务上表现卓越,同时在英语任务上保持竞争力
计算效率优化
相比同规模模型显著降低计算成本
高质量数据过滤
采用严格的数据过滤流程确保训练数据质量
模型能力
文本生成
多语言理解
问答系统
代码生成
使用案例
教育
韩语学习助手
帮助非韩语母语者学习韩语
客服
双语客服机器人
处理英文和韩文的客户咨询
language:
- 英文
- 韩文 library_name: transformers license: cc-by-nc-4.0 pipeline_tag: text-generation model_id: kakaocorp/kanana-nano-2.1b-base repo: kakaocorp/kanana-nano-2.1b-base developers: Kanana大语言模型 training_regime: bf16混合精度 model-index:
- name: kanana-nano-2.1b-base
results:
- task:
type: 多选题
name: mmlu
dataset:
name: mmlu (5样本)
type: hails/mmlu_no_train
metrics:
- type: 准确率 value: 54.83 name: 准确率
- task:
type: 生成任务
name: kmmlu
dataset:
name: kmmlu直接测试 (5样本)
type: HAERAE-HUB/KMMLU
metrics:
- type: 精确匹配 value: 44.83 name: 精确匹配
- task:
type: 多选题
name: haerae
dataset:
name: haerae (5样本)
type: HAERAE-HUB/HAE_RAE_BENCH
metrics:
- type: 标准化准确率 value: 77.09 name: 标准化准确率
- task:
type: 生成任务
name: gsm8k
dataset:
name: gsm8k (5样本)
type: openai/gsm8k
metrics:
- type: 严格精确匹配 value: 46.32 name: 严格精确匹配
- task:
type: 生成任务
name: humaneval
dataset:
name: humaneval (0样本)
type: openai/openai_humaneval
metrics:
- type: 通过率@1 value: 31.10 name: 通过率@1
- task:
type: 生成任务
name: mbpp
dataset:
name: mbpp (3样本)
type: google-research-datasets/mbpp
metrics:
- type: 通过率@1 value: 46.20 name: 通过率@1
- task:
type: 多选题
name: mmlu
dataset:
name: mmlu (5样本)
type: hails/mmlu_no_train
metrics:
Kanana大语言模型
🤗 模型库   |   📕 技术博客   |   📜 技术报告 |   💻 GitHub代码库
模型介绍
我们推出Kanana系列双语大语言模型(由Kakao开发),该系列模型在韩语任务上展现卓越性能,同时在英语任务上保持竞争力。相比同规模的最先进模型,Kanana显著降低了计算成本。技术报告详细阐述了预训练阶段采用的高效技术方案,包括高质量数据过滤、分阶段预训练、深度扩展以及剪枝与蒸馏。此外,报告还介绍了Kanana模型的后训练方法,涵盖监督微调和偏好优化,旨在提升模型与用户交互的自然流畅度。最后,报告阐述了针对特定场景的语言模型适配方案,如嵌入表示、函数调用和检索增强生成(RAG)。Kanana模型系列参数规模从21亿到325亿不等,其中21亿参数的基础模型、指令模型、嵌入模型、函数调用模型和RAG模型已公开发布,以促进韩语大语言模型的研究发展。
[!重要说明] 本模型的预训练和后训练数据均未包含任何Kakao用户数据。
目录
最新动态
- 📜
2025/02/27
: 发布技术报告和🤗HuggingFace模型权重 - 📕
2025/01/10
: 发布Kanana-Nano
模型开发博客 (Kanana-Nano) - 📕
2024/11/14
: 发布Kanana
模型系列开发博客 (Kanana大语言模型:预训练篇, Kanana大语言模型:后训练篇) - ▶️
2024/11/06
: 发布Kanana
模型开发主题演讲视频 (if(kakaoAI)2024)
性能表现
以下是Kanana
模型系列的部分性能评估结果,完整结果请参阅技术报告。