G

Gemma 2 Llama Swallow 2b It V0.1

由 tokyotech-llm 开发
Gemma-2-Llama-Swallow系列是通过对gemma-2模型进行持续预训练构建的,显著增强了日文语言处理能力,同时保留原有英文能力。
下载量 61
发布时间 : 4/21/2025
模型介绍
内容详情
替代品

模型简介

基于Gemma 2模型构建的多语言大语言模型,专注于增强日语处理能力,同时保持英语能力。适用于文本生成任务。

模型特点

双语能力增强
在保留原有英文能力的同时,显著增强了日文语言处理能力
大规模预训练
使用约2000亿token的日文网络语料、日英维基百科条目等混合数据进行持续预训练
指令微调版本
提供专门为日语构建的合成数据进行监督式微调(SFT)的指令微调版本
多参数规模选择
提供2B、9B和27B三种参数规模的模型变体

模型能力

日语文本生成
英语文本生成
多轮对话
指令理解与执行

使用案例

对话系统
日语客服机器人
用于构建日语客户服务对话系统
内容生成
日语文章创作
生成日语文章、报告等内容