P

Plamo 2 1b

由 pfnet 开发
PLaMo 2 1B是由Preferred Elements公司开发的10亿参数模型,基于英文和日文数据集进行预训练,采用混合架构结合Mamba和滑动窗口注意力机制。
下载量 1,051
发布时间 : 2/5/2025
模型介绍
内容详情
替代品

模型简介

PLaMo 2 1B是一个基于英文和日文预训练的10亿参数模型,采用类似Samba的混合架构,结合了选择性状态空间模型和滑动窗口注意力机制,适用于文本生成任务。

模型特点

混合架构设计
结合Mamba2选择性状态空间模型和滑动窗口注意力机制,提升效率和性能。
多语言支持
支持英文和日文文本生成,适用于双语场景。
优化训练稳定性
增加归一化层以提高训练稳定性,使用Mamba2内核提升计算效率。

模型能力

文本生成
多语言处理

使用案例

文本生成
英文文本续写
根据给定的英文开头生成连贯的后续文本。
日文文本生成
根据日文提示生成相关内容的文本。