Xlangai Jedi 7B 1080p GGUF
Apache-2.0
这是一个使用llama.cpp进行量化的Jedi - 7B - 1080p模型,提供了多种量化类型供用户选择,以平衡文件大小和模型质量。
大型语言模型
英语
X
bartowski
225
1
E N V Y Legion V2.1 LLaMa 70B Elarablated V0.8 Hf GGUF
Legion-V2.1-LLaMa-70B-Elarablated-v0.8-hf是基于LLaMa-70B的量化版本,采用llama.cpp进行优化,提供多种量化选项以适应不同硬件需求。
大型语言模型
E
bartowski
267
1
Nvidia Llama 3.1 Nemotron Nano 4B V1.1 GGUF
其他
基于NVIDIA Llama-3.1-Nemotron-Nano-4B-v1.1模型的量化版本,使用llama.cpp工具进行多种量化处理,适合在资源受限的环境中运行。
大型语言模型
英语
N
bartowski
2,553
8
Qwen2.5 Omni 7B GPTQ Int4
其他
Qwen2.5-Omni 是一个端到端的多模态模型,能够感知文本、图像、音频和视频等多种模态,并以流式方式生成文本和自然语音响应。
多模态融合
Transformers

英语
Q
Qwen
389
8
Gemma 3 12B FornaxV.2 QAT CoT Q4 0 GGUF
这是一个实验性的小型思维模型,旨在8GiB消费级显卡上运行,具备通用推理能力。
大型语言模型
G
ConicCat
98
1
Qwen Qwen3 32B GGUF
Apache-2.0
基于Qwen/Qwen3-32B的量化版本,使用llama.cpp进行量化,支持多种量化类型,适用于不同硬件需求。
大型语言模型
Q
bartowski
49.13k
35
Qwen Qwen3 1.7B GGUF
基于Qwen/Qwen3-1.7B的量化版本,使用llama.cpp进行量化,支持多种量化类型,适用于文本生成任务。
大型语言模型
Q
bartowski
7,150
10
Qwen Qwen3 4B GGUF
Qwen团队提供的Qwen3-4B的Llamacpp imatrix量化版本,支持多种量化类型,适用于文本生成任务。
大型语言模型
Q
bartowski
10.58k
9
Qwen Qwen3 30B A3B GGUF
Apache-2.0
基于Qwen/Qwen3-30B-A3B的量化版本,使用llama.cpp进行多种精度量化,适用于文本生成任务。
大型语言模型
Q
bartowski
79.34k
49
Llama 3.2 1B Instruct GGUF
Llama-3.2-1B-Instruct 是一个基于 Llama 架构的 1B 参数量的指令微调模型,提供多种量化格式以适应不同硬件需求。
大型语言模型
支持多种语言
L
Mungert
708
3
Vicoder Html 32B Preview GGUF
ViCoder-HTML-32B-preview是一款强大的AI模型,专为生成完整网站而设计,包括HTML、Tailwind CSS和JavaScript代码。
大型语言模型
其他
V
vicharai
130
4
Abomimegadarkgasinalgottenevereamession
这是一个基于DARE TIES方法合并的12B参数语言模型,融合了多个预训练模型,旨在提供强大的文本生成能力。
大型语言模型
Transformers

A
ReadyArt
26
1
Qwen2.5 72B Instruct GGUF
其他
Qwen2.5-72B-Instruct的GGUF量化版本,支持多种精度格式,适用于不同硬件环境的高效推理。
大型语言模型
英语
Q
Mungert
1,439
4
Llama 2 7b Chat Hf GGUF
Llama 2是由Meta开发的7B参数规模的大语言模型,提供多种量化版本以适应不同硬件需求。
大型语言模型
英语
L
Mungert
1,348
3
Mxbai Rerank Large V2 GGUF
Apache-2.0
mxbai-rerank-large-v2是一个多语言文本重排序模型,支持多种语言和多种量化格式,适用于不同硬件环境。
文本嵌入
支持多种语言
M
Mungert
2,209
2
Phi 4 GGUF
MIT
phi-4是微软研究院开发的开源语言模型,专注于高质量数据和推理能力,适用于内存/计算受限环境。
大型语言模型
支持多种语言
P
Mungert
1,508
3
Meta Llama 3 8B GGUF
Meta-Llama-3-8B 是一个基于 GGUF 格式的 8B 参数大语言模型,支持多种量化版本,适用于不同硬件环境。
大型语言模型
英语
M
Mungert
1,303
2
RWKV7 Goose World3 2.9B HF GGUF
Apache-2.0
基于flash-linear attention格式的RWKV-7模型,支持多语言文本生成任务。
大型语言模型
支持多种语言
R
Mungert
14.51k
16
Rwkv7 2.9B World GGUF
Apache-2.0
RWKV-7架构的29亿参数大语言模型,支持多语言文本生成任务
大型语言模型
支持多种语言
R
Mungert
748
3
Wan 1.3b Gguf
Apache-2.0
这是一个基于Wan-AI/Wan2.1-T2V-1.3B的gguf量化版本,专为文本生成视频任务设计,兼容comfyui-gguf和gguf节点。
文本生成视频
英语
W
calcuis
3,058
12
Thedrummer Cydonia 24B V2.1 GGUF
其他
Cydonia-24B-v2.1是一个24B参数的大语言模型,经过llama.cpp的imatrix量化处理,提供多种量化版本以适应不同硬件需求。
大型语言模型
T
bartowski
4,417
7
Rombo Org Rombo LLM V3.1 QWQ 32b GGUF
Apache-2.0
Rombo-LLM-V3.1-QWQ-32b是一个32B参数规模的大型语言模型,经过llama.cpp的imatrix量化处理,提供多种量化版本以适应不同硬件需求。
大型语言模型
R
bartowski
2,132
5
Mochi Gguf
Apache-2.0
mochi的gguf量化版本是一个文本生成视频的模型,包含gguf编码器和gguf变分自编码器,适用于快速生成视频内容。
文本生成视频
英语
M
calcuis
284
2
Thedrummer Cydonia 24B V2 GGUF
其他
这是一个24B参数的大语言模型,经过llama.cpp的imatrix量化处理,提供多种量化版本以适应不同硬件需求。
大型语言模型
T
bartowski
5,797
16
Nera Noctis 12B GGUF
其他
Nera_Noctis-12B的Llamacpp imatrix量化版本,基于Nitral-AI/Nera_Noctis-12B模型,支持英文文本生成任务。
大型语言模型
英语
N
bartowski
64
6
Mochi
Apache-2.0
mochi是一个基于gguf量化版本的文本生成视频模型,支持通过文本描述生成视频内容。
文本生成视频
英语
M
calcuis
140
8
Aura 4B GGUF
Apache-2.0
Aura-4B是一个基于AuraIndustries/Aura-4B的量化版本,使用llama.cpp进行imatrix量化,支持多种量化类型,适用于文本生成任务。
大型语言模型
英语
A
bartowski
290
8
Mixtral 8x7B V0.1
Apache-2.0
Mixtral-8x7B是一个预训练的生成式稀疏混合专家模型,在多数基准测试中表现优于Llama 2 70B。
大型语言模型
Transformers

支持多种语言
M
mistralai
42.78k
1,709
Starcoder2 3b
Openrail
StarCoder2-3B是一个拥有30亿参数的代码生成模型,基于17种编程语言训练而成,支持16,384标记的上下文窗口。
大型语言模型
Transformers

其他
S
bigcode
199.62k
178
Blip2 Flan T5 Xl Sharded
MIT
这是BLIP-2模型的分片版本,采用Flan T5-xl实现图像到文本任务,如图像描述和视觉问答。
图像生成文本
Transformers

英语
B
ethzanalytics
71
6
Nystromformer 4096
基于WikiText-103 v1数据集训练的长序列Nyströmformer模型,支持4096长度的序列处理
大型语言模型
Transformers

N
uw-madison
74
3
Nystromformer 2048
基于WikiText-103数据集训练的Nystromformer模型,支持长序列处理(2048 tokens)
大型语言模型
Transformers

N
uw-madison
38
1
精选推荐AI模型
Llama 3 Typhoon V1.5x 8b Instruct
专为泰语设计的80亿参数指令模型,性能媲美GPT-3.5-turbo,优化了应用场景、检索增强生成、受限生成和推理任务
大型语言模型
Transformers

支持多种语言
L
scb10x
3,269
16
Cadet Tiny
Openrail
Cadet-Tiny是一个基于SODA数据集训练的超小型对话模型,专为边缘设备推理设计,体积仅为Cosmo-3B模型的2%左右。
对话系统
Transformers

英语
C
ToddGoldfarb
2,691
6
Roberta Base Chinese Extractive Qa
基于RoBERTa架构的中文抽取式问答模型,适用于从给定文本中提取答案的任务。
问答系统
中文
R
uer
2,694
98
AIbase是一个专注于MCP服务的平台,为AI开发者提供高质量的模型上下文协议服务,助力AI应用开发。
简体中文