G

Gemma 2 Llama Swallow 27b It V0.1

由 tokyotech-llm 开发
基于Gemma-2架构的日语增强大语言模型,通过持续预训练显著提升日语能力,同时保留原版英语能力
下载量 27
发布时间 : 4/24/2025
模型介绍
内容详情
替代品

模型简介

该模型是对Google Gemma-2进行持续预训练构建的系列模型之一,特别针对日语处理能力进行了优化,适用于日英双语文本生成和理解任务

模型特点

双语能力增强
在保留原版Gemma 2英语能力的同时,显著增强了日语处理能力
大规模预训练
使用约2000亿tokens的混合语料进行持续预训练,包含专业日语语料
指令微调优化
采用针对日语特别构建的合成数据进行监督式微调(SFT)

模型能力

日语文本生成
英语文本生成
日英双语理解
多轮对话处理
代码生成

使用案例

语言服务
日语聊天助手
构建流畅自然的日语对话系统
在日语MT-Bench评测中表现优异
日英翻译
实现高质量的日英互译
在WMT20评测基准上有竞争力表现
教育
日语学习辅助
帮助非日语母语者学习日语