Llama-3.1-Nemotron-Nano-4B-v1.1-GGUF开源大语言模型

首页

Llama 3.1 Nemotron Nano 4B V1.1 GGUF

由 lmstudio-community 开发

由英伟达发布的4B参数规模大语言模型，支持128k tokens上下文长度，专为推理、对话及RAG等任务优化

大型语言模型英语开源协议:其他 #长上下文推理 #对话优化 #RAG增强

下载量 588

发布时间 : 5/20/2025

模型简介

基于Llama 3.1 8B模型通过剪枝和蒸馏创建的轻量级模型，优化了人类对话偏好及检索增强生成(RAG)、工具调用等能力

模型特点

超长上下文支持

支持128k tokens的上下文窗口，适合处理长文档和复杂对话场景

轻量化设计

通过剪枝和蒸馏技术从8B模型压缩而来，保持性能的同时降低计算需求

对话优化

专门针对人类对话偏好进行优化，生成更自然的交互响应

模型能力

文本生成

对话系统

检索增强生成(RAG)

工具调用

使用案例

智能助手

客服对话系统

部署为在线客服助手处理用户咨询

能理解复杂问题并生成符合业务场景的回复

知识处理

长文档分析

处理技术文档、法律文书等长文本材料

利用128k上下文窗口保持长期记忆和连贯理解

🚀 英伟达Llama 3.1 Nemotron Nano 4B v1.1社区模型

该模型入选了 LM Studio 社区模型亮点计划，此计划旨在展示社区中新颖且值得关注的模型。快来 Discord 参与讨论吧！

模型信息

属性	详情
量化者	bartowski
任务类型	文本生成
基础模型	nvidia/Llama-3.1-Nemotron-Nano-4B-v1.1
许可证名称	nvidia-open-model-license
语言	英语
训练数据集	nvidia/Llama-Nemotron-Post-Training-Dataset
标签	nvidia、llama-3
许可证	其他
许可证链接	https://www.nvidia.com/en-us/agreements/enterprise-software/nvidia-open-model-license/
基础模型关系	量化版本

模型创建者：nvidia
原始模型：Llama-3.1-Nemotron-Nano-4B-v1.1
GGUF 量化：由 bartowski 基于 llama.cpp 版本 b5432 提供

🔧 技术细节

支持 128k 令牌的上下文长度。
由 Llama 3.1 8B 经过剪枝和蒸馏创建而成。
针对推理、人类对话偏好以及诸如 RAG 和工具调用等任务进行了调优。

🙏 特别感谢

特别感谢 Georgi Gerganov 以及整个 llama.cpp 团队，是他们让这一切成为可能。

⚠️ 免责声明

LM Studio 并非社区模型计划中任何模型的创建者、发起者或所有者。每个社区模型均由第三方创建和提供。LM Studio 不认可、支持、代表或保证任何社区模型的完整性、真实性、准确性或可靠性。您应明白，社区模型可能会生成具有冒犯性、有害性、不准确或其他不当或欺骗性的内容。每个社区模型的唯一责任方是发起该模型的个人或实体。LM Studio 可能不会监控或控制社区模型，并且不能也不会对任何此类模型承担责任。LM Studio 不承担关于社区模型的准确性、可靠性或益处的所有保证或担保。此外，LM Studio 不保证社区模型将满足您的要求，保证其安全性、不间断性或在任何时间或地点可用，或保证无错误、无病毒，或保证任何错误将得到纠正等。您将对因使用或访问社区模型、下载任何社区模型或使用 LM Studio 提供或通过 LM Studio 提供的任何其他社区模型而导致的任何损害承担全部责任。