N

Nemotron Mini 4B Instruct

由 nvidia 开发
Nemotron-Mini-4B-Instruct是英伟达开发的专为角色扮演、检索增强生成和函数调用优化的响应生成模型,基于Minitron-4B-Base微调,支持4096个token的上下文长度。
下载量 674
发布时间 : 9/10/2024
模型介绍
内容详情
替代品

模型简介

一款经过蒸馏、剪枝和量化优化的小型语言模型,在速度和设备端部署方面表现卓越,针对英文场景的角色扮演、RAG问答和函数调用进行了优化。

模型特点

高效部署
通过蒸馏、剪枝和量化技术优化,适合设备端部署
多功能优化
专门针对角色扮演、RAG问答和函数调用场景优化
长上下文支持
支持4096个token的上下文长度
商业友好
开放商业使用许可

模型能力

角色扮演对话
检索增强生成
函数调用
英文文本生成

使用案例

游戏开发
游戏角色AI
集成到视频游戏中为NPC提供智能对话
参见NVIDIA ACE演示视频
智能助手
个性化聊天机器人
创建具有特定角色风格的对话助手
支持海盗风格等多种角色设定
企业应用
RAG问答系统
构建基于检索增强生成的问答系统