S

Stockmark 13b

由 stockmark 开发
Stockmark-13b 是一个基于约2200亿标记日语语料库从头预训练的130亿参数大语言模型,由Stockmark Inc.开发。
下载量 604
发布时间 : 10/21/2023
模型介绍
内容详情
替代品

模型简介

这是一个专注于日语处理的大语言模型,适用于文本生成等自然语言处理任务。

模型特点

大规模日语预训练
基于2200亿标记的日语语料库训练,专注于日语处理能力
AWS Trainium支持
获得AWS大语言模型开发支持计划支持,使用Trainium加速器训练
量化支持
支持8位量化,可在T4或V100等GPU上运行

模型能力

日语文本生成
自然语言理解
上下文学习

使用案例

自然语言处理
日语文本生成
生成连贯的日语文本
可生成128个新token的连贯文本
技术文档处理
处理专利文献等技术文档