L

Llama 3.1 Nemotron Nano 4B V1.1 GGUF

由 lmstudio-community 开发
由英伟达发布的4B参数规模大语言模型,支持128k tokens上下文长度,专为推理、对话及RAG等任务优化
下载量 588
发布时间 : 5/20/2025
模型介绍
内容详情
替代品

模型简介

基于Llama 3.1 8B模型通过剪枝和蒸馏创建的轻量级模型,优化了人类对话偏好及检索增强生成(RAG)、工具调用等能力

模型特点

超长上下文支持
支持128k tokens的上下文窗口,适合处理长文档和复杂对话场景
轻量化设计
通过剪枝和蒸馏技术从8B模型压缩而来,保持性能的同时降低计算需求
对话优化
专门针对人类对话偏好进行优化,生成更自然的交互响应

模型能力

文本生成
对话系统
检索增强生成(RAG)
工具调用

使用案例

智能助手
客服对话系统
部署为在线客服助手处理用户咨询
能理解复杂问题并生成符合业务场景的回复
知识处理
长文档分析
处理技术文档、法律文书等长文本材料
利用128k上下文窗口保持长期记忆和连贯理解