# 量化推理

Treevgr 7B CI I1 GGUF
Apache-2.0
TreeVGR-7B-CI 是一个基于视觉的问答、视觉定位和视觉推理的模型量化版本,适用于多种视觉任务场景。
文本生成图像 Transformers 英语
T
mradermacher
254
1
Chengsenwang ChatTime 1 7B Chat GGUF
Apache-2.0
ChatTime-1-7B-Chat是一个专注于时间序列预测的多模态基础模型,基于7B参数规模构建。
多模态融合
C
tensorblock
153
0
Llama 3.2 1B Instruct GGUF
Llama-3.2-1B-Instruct 是一个基于 Llama 架构的 1B 参数量的指令微调模型,提供多种量化格式以适应不同硬件需求。
大型语言模型 支持多种语言
L
Mungert
708
3
Mxbai Rerank Large V2 GGUF
Apache-2.0
mxbai-rerank-large-v2是一个多语言文本重排序模型,支持多种语言和多种量化格式,适用于不同硬件环境。
文本嵌入 支持多种语言
M
Mungert
2,209
2
Gemma 3 4b Novision
Gemma-3-4b纯文本模型是基于google/gemma-3-4b-it转换而来的纯文本版本,移除了视觉组件,专注于文本生成任务。
大型语言模型 Transformers
G
gghfez
40.57k
2
Gemmax2 28 2B 4bit
Apache-2.0
GemmaX2-28-2B GGUF量化模型是小米开发的GemmaX2-28-2B-v0.1翻译大语言模型的量化版本集合,支持28种语言的机器翻译任务。
机器翻译 Transformers 支持多种语言
G
Tonic
19
1
Whisperkit Pro
其他
WhisperKit Pro 是 WhisperKit 的商业版本,专注于自动语音识别(ASR)任务,支持量化技术,适用于高效语音处理。
语音识别
W
argmaxinc
1,862
14
Chinese Llama 2 7b Gguf
Apache-2.0
适配llama.cpp的中文LLaMA-2-7B模型的GGUF-v3版本文件
大型语言模型 Transformers 支持多种语言
C
hfl
254
5
AIbase
智启未来,您的人工智能解决方案智库
简体中文