S

Swallow 7b Instruct Hf

由 tokyotech-llm 开发
基于Llama 2系列优化的日语增强型大语言模型,通过监督式微调提升指令跟随能力
下载量 1,938
发布时间 : 12/7/2023
模型介绍
内容详情
替代品

模型简介

燕子模型是东京工业大学LLM团队开发的日语优化大语言模型,在Llama 2基础上通过持续预训练和指令微调增强日语处理能力,支持日英双语任务。

模型特点

日语优化词表
扩展了日语专用token,显著提升日语文本编码效率
双语支持
同时支持日语和英语任务处理
指令微调
通过监督式微调(SFT)增强指令理解和执行能力

模型能力

日语文本生成
英语文本生成
常识推理
开放问答
阅读理解
摘要生成
数学推理
机器翻译

使用案例

教育
日语学习助手
帮助学生理解日语语法和词汇
在JCommonsenseQA日语常识测试中准确率达48.08%
内容创作
日语文章生成
根据提示生成连贯的日语文章
在XL-Sum摘要任务中得分18.30%
翻译服务
日英互译
实现日语和英语之间的互译
WMT20英日翻译BLEU得分25.10%