L

Llama 3.3 Swallow 70B Instruct V0.4

由 tokyotech-llm 开发
Llama 3.3 Swallow是基于Meta Llama 3.3模型进行持续预训练的大型语言模型(70B),增强了日语能力同时保留原有英语能力。
下载量 874
发布时间 : 4/25/2025
模型介绍
内容详情
替代品

模型简介

通过对Llama 3.3模型进行持续预训练构建的日语增强型大语言模型,适用于双语文本生成任务。

模型特点

双语能力增强
在保留Llama 3.3原有英语能力的基础上,显著提升了日语处理能力
大规模持续预训练
使用约3150亿个标记的日语和英语数据进行持续预训练
指令调优优化
通过对日语构建的合成数据进行监督微调(SFT),提升指令跟随能力

模型能力

日语文本生成
英语文本生成
双语翻译
指令跟随
代码生成

使用案例

语言处理
日语内容创作
生成高质量的日语文章、报告等
在JMT-Bench JA评估中获得0.772平均分
英日双语翻译
提供英语和日语之间的互译服务
WMT20翻译任务中表现良好
教育
日语学习辅助
为日语学习者提供语法解释和练习生成