N

Nvidia Llama 3.1 Nemotron Nano 4B V1.1 GGUF

由 bartowski 开发
基于NVIDIA Llama-3.1-Nemotron-Nano-4B-v1.1模型的量化版本,使用llama.cpp工具进行多种量化处理,适合在资源受限的环境中运行。
下载量 2,553
发布时间 : 5/20/2025
模型介绍
内容详情
替代品

模型简介

这是一个4B参数规模的大语言模型,经过多种量化处理以减小模型体积,同时保持较高的推理质量。支持英语文本生成任务。

模型特点

多种量化选项
提供从BF16到Q2_K等多种量化版本,满足不同硬件和性能需求
嵌入/输出权重优化
部分量化版本(Q3_K_XL、Q4_K_L等)的嵌入和输出权重使用Q8_0量化,提高质量
ARM/AVX优化
支持在线重打包功能,优化在ARM和AVX硬件上的运行性能
广泛兼容性
可在LM Studio、llama.cpp及任何基于llama.cpp的项目中运行

模型能力

英语文本生成
对话系统
内容创作

使用案例

对话系统
智能助手
构建英语对话型智能助手
能够理解并生成自然的英语对话
内容创作
文本生成
生成各种类型的英语文本内容
可生成连贯、有逻辑的英语文章