S

SEA LION V1 3B

由 aisingapore 开发
SEA-LION是针对东南亚地区优化的多语言大语言模型,支持11种东南亚语言,基于MPT架构构建。
下载量 1,340
发布时间 : 10/24/2023

模型简介

SEA-LION是一系列针对东南亚语言优化的预训练大语言模型,旨在提升该地区语言的自然语言处理能力。v1-3B版本具有30亿参数,支持英语、中文及9种东南亚语言。

模型特点

东南亚语言优化
专门针对11种东南亚语言进行训练,包括低资源语言如缅甸语、高棉语等
定制分词器
使用专为东南亚语言设计的SEABPETokenizer,提升多语言处理性能
大规模训练数据
在9800亿token的多语言数据上训练,包含多种专业领域数据
高效架构
基于MPT架构优化,在3B参数规模下保持良好性能

模型能力

多语言文本生成
跨语言理解
代码生成(Python/JavaScript等)
学术文本处理
东南亚语言翻译

使用案例

多语言应用
东南亚语言客服机器人
为东南亚地区企业提供多语言客户支持
支持11种语言的自动问答
跨语言信息检索
处理东南亚多语言内容搜索请求
实现不同语言间的语义搜索
教育
语言学习助手
帮助学习东南亚语言的学习者
提供语法解释和例句生成
AIbase
智启未来,您的人工智能解决方案智库
简体中文