L

Llama 3 Youko 8b

由 rinna 开发
基于Meta-Llama-3-8B在混合日语和英语数据集上进行220亿token持续预训练的日语优化模型
下载量 1,249
发布时间 : 5/1/2024
模型介绍
内容详情
替代品

模型简介

该模型通过对Llama 3 8B进行持续预训练,显著提升了日语任务表现,适用于日语文本生成和理解任务

模型特点

日语优化
在220亿token的日语语料上进行持续预训练,显著提升日语处理能力
多源数据训练
融合了CC-100、C4、OSCAR、The Pile、维基百科等多种高质量数据集
双语支持
同时支持日语和英语处理,适合双语应用场景

模型能力

日语文本生成
英语文本生成
文本理解
上下文学习

使用案例

内容创作
日语文章生成
生成符合日语表达习惯的各类文章
生成流畅自然的日语文本
教育
日语学习辅助
帮助日语学习者生成例句或解释语法