L

Llm Jp 3 13b

由 llm-jp 开发
由日本国立信息学研究所开发的大语言模型,支持日语和英语,基于Transformer架构,参数量130亿
下载量 1,190
发布时间 : 9/23/2024
模型介绍
内容详情
替代品

模型简介

这是一个基于Transformer架构的大语言模型,专门针对日语和英语优化,可用于文本生成等自然语言处理任务

模型特点

多语言支持
专门针对日语和英语优化,在两种语言上都有良好表现
大规模预训练
使用超过2.1万亿token的混合数据集进行预训练
多种规模可选
提供从18亿到172亿参数的不同规模模型变体
指令调优版本
提供经过指令微调的版本,更适合对话和指令跟随任务

模型能力

日语文本生成
英语文本生成
代码生成
问答系统
阅读理解

使用案例

自然语言处理
日语问答系统
构建针对日语用户的智能问答系统
在llm-jp-eval评估中问答任务得分0.5937
机器翻译
用于日语和英语之间的机器翻译
在llm-jp-eval评估中机器翻译任务得分0.8292
教育
语言学习助手
帮助学习者练习日语和英语