M

Mamba 3B Slimpj

由 Q-bert 开发
基于Mamba架构的3B参数规模的语言模型,支持英文文本生成任务。
下载量 56
发布时间 : 12/28/2023
模型介绍
内容详情
替代品

模型简介

Mamba-3B-slimpj是一个基于Mamba架构的轻量级语言模型,主要用于英文文本生成任务。

模型特点

高效架构
基于Mamba架构,具有高效的序列建模能力。
轻量级
3B参数规模,相对轻量。
易于集成
支持通过Hugging Face Transformers库轻松集成。

模型能力

英文文本生成
序列建模

使用案例

文本生成
对话生成
可用于生成对话回复。
示例中展示了生成的工作相关对话回复。