# 高精度推理

Nvidia OpenReasoning Nemotron 32B GGUF
NVIDIA OpenReasoning - Nemotron - 32B的量化版本,通过llama.cpp进行量化处理,减少模型存储和计算资源需求,便于部署。
大型语言模型
N
bartowski
2,382
1
Nvidia OpenReasoning Nemotron 14B GGUF
这是NVIDIA的OpenReasoning-Nemotron-14B模型的量化版本,旨在提升模型在不同硬件上的运行效率和性能。
大型语言模型
N
bartowski
1,039
1
Nvidia OpenReasoning Nemotron 7B GGUF
NVIDIA OpenReasoning-Nemotron-7B模型的量化版本,使用llama.cpp工具进行量化处理,提升在不同硬件上的运行效率和性能。
大型语言模型
N
bartowski
933
4
Ddh0 Cassiopeia 70B GGUF
这是对ddh0/Cassiopeia-70B模型进行量化处理后的版本,通过量化技术减少模型存储空间并提升推理速度。
大型语言模型
D
bartowski
167
2
T Pro It 2.0
Apache-2.0
T-pro-it-2.0 是基于 Qwen 3 模型家族构建的模型,结合了持续预训练和对齐技术,能在多种任务中提供高质量的推理和响应。
大型语言模型 Transformers 其他
T
t-tech
1,405
90
Llama 3.3 70B Instruct FP8
IONOS Llama 3.3 70B Instruct FP8 是 Meta 的 Llama 3.3 70B Instruct 模型的优化版本,采用 FP8 量化技术提升性能和效率,适合生产环境部署。
大型语言模型 Transformers 支持多种语言
L
ionos
103
2
Clip Finetuned Deepfashion
这是一个自动生成的🤗 Transformers模型卡片,缺少具体模型信息。
大型语言模型 Transformers
C
anhquanlam
240
0
Disk
这是一个Hugging Face模型中心的Transformer模型,具体信息待补充
大型语言模型 Transformers
D
stevenbucaille
138
1
Polaris 4B Preview F32 GGUF
Apache-2.0
Polaris是一种开源的后训练方法,利用强化学习优化和增强模型,提升推理能力。
大型语言模型 Transformers 英语
P
prithivMLmods
765
1
F0
这是一个自动生成的transformers模型卡片,具体信息待补充。
大型语言模型 Transformers
F
vdmbrsv
2,602
1
Um P2 Fine Tuned Llama Full 2
这是一个已推送到Hub上的transformers模型,具体功能和用途待补充。
大型语言模型 Transformers
U
ElijahLiew2
152
1
Skywork Skywork OR1 7B GGUF
Skywork-OR1-7B 是一个 7B 参数规模的大语言模型,提供多种量化版本以适应不同硬件需求。
大型语言模型
S
bartowski
634
1
Andrewzh Absolute Zero Reasoner Coder 14b GGUF
基于andrewzh的Absolute_Zero_Reasoner-Coder-14b模型,使用llama.cpp进行imatrix量化的版本,适用于推理和代码生成任务。
大型语言模型
A
bartowski
1,995
5
Voicelab Trurl 2 13b GGUF
trurl-2-13b是一个13B参数规模的大语言模型,提供GGUF格式的量化版本,适用于多种自然语言处理任务。
大型语言模型 支持多种语言
V
tensorblock
190
1
Servicenow AI Apriel Nemotron 15b Thinker GGUF
MIT
这是一个由ServiceNow语言模型(SLAM)实验室构建的15B参数大语言模型,经过llama.cpp工具量化处理,适用于本地推理部署。
大型语言模型
S
bartowski
3,707
11
Qwen3 32B Quantized.w4a16
Apache-2.0
Qwen3-32B的INT4量化版本,通过权重量化减少75%的磁盘和GPU内存需求,保持高性能
大型语言模型 Transformers
Q
RedHatAI
2,213
5
Skin Disease Classifier
这是一个托管在Hugging Face Hub上的transformers模型,具体功能和用途尚未明确说明。
大型语言模型 Transformers
S
muhammadnoman76
28
0
Qwen3 32B FP8 Dynamic
Apache-2.0
基于Qwen3-32B进行FP8动态量化的高效语言模型,显著降低内存需求并提升计算效率
大型语言模型 Transformers
Q
RedHatAI
917
8
Qwen3 4B Mishima Imatrix GGUF
Apache-2.0
基于Qwen3-4B的Mishima Imatrix量化版本,通过特定数据集增强散文风格生成能力
大型语言模型
Q
DavidAU
105
2
Mlabonne Qwen3 8B Abliterated GGUF
这是Qwen3-8B-abliterated模型的量化版本,使用llama.cpp进行量化,适用于文本生成任务。
大型语言模型
M
bartowski
6,892
5
Qwen3 30B A3B Base
Apache-2.0
Qwen3-30B-A3B-Base是Qwen系列最新一代大语言模型,在训练数据、模型架构和优化技术等方面有诸多改进,提供更强大的语言处理能力。
大型语言模型 Transformers
Q
unsloth
1,822
3
Qwen Qwen3 8B GGUF
Apache-2.0
Qwen3-8B的量化版本,使用llama.cpp的imatrix选项进行量化,适用于文本生成任务。
大型语言模型
Q
bartowski
23.88k
18
Kogptv3 Contextbasedv4
该模型是一个基于transformers库的模型,具体功能和用途需要进一步信息补充。
大型语言模型 Transformers
K
KingKDB
90
2
774M Export
该模型是一个基于transformers库的模型,具体用途和功能需要进一步信息确认。
大型语言模型 Transformers
7
karpathy
25
2
Imagecaptioning4
这是一个托管在Hugging Face Hub上的transformers模型,具体功能和用途尚未明确说明。
大型语言模型 Transformers
I
eduardo-bolognini
82
1
Gemma 3 4B It Qat GGUF
Google出品的Gemma 3 4B IT模型,支持多模态输入和长上下文处理,适用于文本生成和图像理解任务。
图像生成文本
G
lmstudio-community
46.55k
10
Dreamgen Lucid V1 Nemo GGUF
其他
基于 dreamgen/lucid-v1-nemo 的量化模型,使用 llama.cpp 进行多种量化处理,适用于文本生成任务。
大型语言模型 英语
D
bartowski
6,593
5
Sparklerl 7B Stage1
这是一个已发布在Hub上的transformers模型,具体功能和详细信息待补充。
大型语言模型 Transformers
S
sparkle-reasoning
1,551
1
Sparklerl 7B Stage2 Aug
这是一个自动生成的transformers模型卡片,具体信息待补充。
大型语言模型 Transformers
S
sparkle-reasoning
1,551
1
T5 Typo Correction V3
这是一个由系统自动生成的transformers模型卡片,具体模型信息待补充。
大型语言模型 Transformers
T
Wguy
303
1
Openclip ViT G FARE2
MIT
该模型是一个基于Transformers架构的模型,具体用途和功能需要进一步信息确认。
大型语言模型 Transformers
O
RCLIP
25
0
News Classification
这是一个托管在Hugging Face Hub上的transformers模型,具体功能和用途需进一步补充信息。
大型语言模型 Transformers
N
Sanali18
111
1
Phi 4 GGUF
MIT
phi-4是微软研究院开发的开源语言模型,专注于高质量数据和推理能力,适用于内存/计算受限环境。
大型语言模型 支持多种语言
P
Mungert
1,508
3
Reasonflux F1 7B
其他
ReasonFlux-F1-7B是基于思维模板扩展的分层大语言模型推理模型,通过模板增强推理轨迹微调而成,在多项推理任务中表现优异。
大型语言模型 Transformers
R
Gen-Verse
291
2
Reasonflux F1
其他
ReasonFlux-F1-32B是基于思维模板扩展的分层大语言模型,通过模板增强推理轨迹微调,在推理任务中表现优异。
大型语言模型 Transformers
R
Gen-Verse
123
8
Deepfake Detector Faceforensics
这是一个托管在Hugging Face Hub上的transformers模型,具体功能和用途需进一步补充信息。
大型语言模型 Transformers
D
HrutikAdsare
57
1
Full Finetuned Bert Qa
这是一个托管在Hugging Face Hub上的transformers模型,具体功能和用途需要进一步补充信息。
大型语言模型 Transformers
F
reidddd
55
1
Alphatable 1.5B
该模型是一个基于transformers库的模型,具体用途和功能未明确说明。
大型语言模型 Transformers
A
jan-hq
72
2
Reasoning TIES Coder V1.1
Apache-2.0
这是一个使用TIES方法合并的32B参数规模的大语言模型,基于Rombo-LLM-V3.1-QWQ-32b基础模型融合了多个FuseAI预览模型
大型语言模型 Transformers
R
BenevolenceMessiah
74
2
Bytedance Research.ui TARS 72B SFT GGUF
字节跳动研究团队发布的72B参数规模的多模态基础模型,专注于图像文本转文本任务
图像生成文本
B
DevQuasar
81
1
AIbase
智启未来,您的人工智能解决方案智库
简体中文