N

Nekomata 14b

由 rinna 开发
基于Qwen-14B在混合日语和英语数据集上持续预训练的大语言模型,显著提升日语任务表现
下载量 705
发布时间 : 12/19/2023
模型介绍
内容详情
替代品

模型简介

该模型是在660亿token的混合日语和英语语料上对Qwen-14B进行持续预训练得到的,特别优化了日语处理能力,同时保留了原始Qwen模型的优秀特性。

模型特点

高效日语处理
使用Qwen词汇表(词汇量>15万),日语文本处理效率比youri系列更高
长上下文支持
支持最大8192的序列长度
多语言能力
在日语和英语混合语料上训练,具备双语处理能力
高性能分词
使用扩展的cl100k tiktoken分词器,日语分词效率显著优于llama-2分词器

模型能力

日语文本生成
英语文本生成
长文本处理

使用案例

内容创作
日语文章续写
根据开头自动生成连贯的日语文章
示例中展示了'西田幾多郎は、'开头的文章续写效果
语言学习
双语文本生成
生成日语和英语的双语内容