P

Plamo 2 8b

由 pfnet 开发
PLaMo 2 8B是由Preferred Elements公司开发的80亿参数混合架构语言模型,支持英语和日语文本生成。
下载量 401
发布时间 : 2/7/2025

模型简介

基于英语和日语数据集预训练的大规模语言基础模型,采用类似Samba的混合架构(结合选择性状态空间模型与滑动窗口注意力机制),专注于高效文本生成。

模型特点

高效混合架构
整合Mamba2选择性状态空间模型与滑动窗口注意力机制,相比传统Transformer具有更高计算效率
双语支持
针对英语和日语优化,训练数据包含6万亿token(英语45%/日语30%)
商业友好许可
年收入低于10亿日元的组织可申请商业用途许可(需注册)
训练稳定性增强
新增归一化层和改进的Mamba2内核,提升大规模训练稳定性

模型能力

英语文本生成
日语文本生成
代码生成(有限支持)
开放域问答

使用案例

内容创作
多语言内容生成
自动生成英语/日语营销文案、博客文章等
企业应用
内部知识处理
文档摘要、报告生成等组织内部非商业用途
需遵守收入限制条款
AIbase
智启未来,您的人工智能解决方案智库
简体中文