N

Nemotron H 47B Base 8K

由 nvidia 开发
NVIDIA Nemotron-H-47B-Base-8K 是由 NVIDIA 开发的大型语言模型(LLM),设计用于对给定文本进行补全。该模型采用混合架构,主要由 Mamba-2 和 MLP 层组成,并仅包含五个注意力层。
下载量 1,242
发布时间 : 4/8/2025
模型介绍
内容详情
替代品

模型简介

Nemotron-H-47B-Base-8K 是一个大型语言模型,支持 8K 上下文长度,适用于文本生成任务。支持多种语言,包括英语、德语、西班牙语、法语、意大利语、韩语、葡萄牙语、俄语、日语和中文。

模型特点

混合架构
采用 Mamba-2 和 MLP 层的混合架构,仅包含五个注意力层,提高了模型的效率和性能。
多语言支持
支持 10 种语言,包括英语、德语、西班牙语、法语、意大利语、韩语、葡萄牙语、俄语、日语和中文。
8K 上下文长度
支持长达 8K 的上下文长度,适用于处理长文本任务。
高效训练
通过 630 亿 token 从 Nemotron-H-56B-Base-8K 剪枝和蒸馏而来,优化了训练效率。

模型能力

文本生成
多语言文本补全
长文本处理

使用案例

研究与开发
大型语言模型研究
用于构建和优化大型语言模型的研究项目。
支持多种语言和长上下文处理。
文本生成任务
用于生成和补全文本内容,如文章、对话等。
生成高质量的多语言文本。