S

Shisa V1 Llama3 8b

由 shisa-ai 开发
基于Meta-Llama-3-8B-Instruct微调的日语优化大语言模型,在多个日语基准测试中表现优异
下载量 28
发布时间 : 5/21/2024
模型介绍
内容详情
替代品

模型简介

这是一个针对日语优化的8B参数大语言模型,基于Llama 3架构微调,在ELYZA100、日语MT-Bench等日语评估基准上取得良好成绩

模型特点

日语优化
专门针对日语任务进行优化,日语字符占比达91%以上
多基准表现优异
在ELYZA100、日语MT-Bench、Rakuda等多个日语评估基准上超越同类模型
精细调优
通过不同学习率实验确定8e-6为最优参数,避免过拟合

模型能力

日语文本生成
日语问答
日语文本理解
多轮对话

使用案例

日语NLP应用
日语客服机器人
用于处理日语客户咨询
在Rakuda基准上得分7.05,优于多数同类模型
日语内容创作
生成符合日语表达习惯的文本内容
日语字符占比91.3%,表达自然度较高