K

Kosolar 10.7B V0.2

由 yanolja 开发
基于upstage/SOLAR-10.7B-v1.0的韩语词汇扩展版本,专门针对韩语网络爬取数据集进行了微调。
下载量 21
发布时间 : 1/18/2024

模型简介

本模型通过预训练新词元的嵌入,并对已有词元的`lm_head`嵌入进行部分微调,扩展了对韩语的理解能力,同时保留了基础模型的原始参数。

模型特点

韩语词汇扩展
通过精心挑选的8,960个韩语词元扩展了词汇表,提升了韩语理解能力。
选择性参数冻结
冻结已有词元的`embed_tokens`层,解冻`lm_head`层,平衡了韩语能力与原始语言性能。
多语料训练
训练数据包含韩语网络内容(83.46%)、多语料库(10.69%)和英语到韩语的段落对(5.86%)。

模型能力

韩语文本生成
多语言文本生成

使用案例

自然语言处理
韩语内容生成
生成符合韩语习惯的文本内容
多语言翻译辅助
辅助英语到韩语的翻译任务
AIbase
智启未来,您的人工智能解决方案智库
简体中文