M

Mamba 130m Hf

由 state-spaces 开发
Mamba是一个与transformers兼容的序列建模模型,具有高效的推理能力。
下载量 46.83k
发布时间 : 3/6/2024
模型介绍
内容详情
替代品

模型简介

Mamba是一个基于状态空间模型(SSM)的序列建模架构,适用于因果语言建模任务。该模型提供了优化的CUDA内核实现,支持高效的文本生成。

模型特点

高效推理
通过优化的CUDA内核实现高效推理,支持长序列处理
状态空间架构
采用状态空间模型(SSM)架构,适合序列建模任务
PEFT兼容
支持参数高效微调(PEFT)技术,如LoRA

模型能力

文本生成
语言建模
序列建模

使用案例

文本生成
对话生成
用于构建聊天机器人或对话系统
示例显示能生成连贯的对话回复
内容创作
辅助写作和内容生成