L

Llama 3 Swallow 8B V0.1

由 tokyotech-llm 开发
基于Meta Llama 3构建的日语增强大语言模型,通过持续预训练和指令微调提升日语处理能力
下载量 2,230
发布时间 : 5/20/2024

模型简介

Llama3 Swallow是基于Meta Llama 3系列模型进行日语数据增强训练的变体,包含8B和70B两种参数规模,支持英语和日语文本生成任务

模型特点

日语能力增强
通过大量日语数据持续预训练,显著提升日语任务表现
双语支持
同时支持英语和日语处理,在双语任务中表现优异
指令优化版本
提供经过监督微调(SFT)和聊天向量技术优化的指令版本

模型能力

日语文本生成
英语文本生成
机器翻译
问答系统
代码生成
数学推理
摘要生成

使用案例

自然语言处理
日语问答系统
构建面向日语用户的智能问答应用
在JCommonsenseQA基准上达到89.45%准确率
英日机器翻译
实现高质量英日双向翻译
WMT20英日翻译BLEU得分0.2758
教育应用
日语学习助手
辅助日语学习者进行语言练习和知识查询
AIbase
智启未来,您的人工智能解决方案智库
简体中文