H

Hymba 1.5B Base

由 nvidia 开发
Hymba-1.5B-Base 是 NVIDIA 开发的一款基础文本生成模型,采用混合架构结合 Mamba 和注意力头,适用于多种自然语言生成任务。
下载量 3,492
发布时间 : 10/9/2024
模型介绍
内容详情
替代品

模型简介

该模型采用混合架构,结合了并行运行的 Mamba 和注意力头,通过元标记提升模型效能,支持多种自然语言生成任务。

模型特点

混合架构
结合 Mamba 和注意力头的并行处理,提升模型效能。
元标记
预置于输入序列前的可学习标记,存储重要信息并减轻注意力负担。
高效内存使用
通过跨层 KV 共享和全局-局部注意力机制优化内存和计算效率。

模型能力

文本生成
自然语言处理
多任务处理

使用案例

自然语言生成
对话生成
用于生成自然语言对话回复。
在 2B 参数以下的公开模型中表现最优。