多语言生成
Falcon H1 34B Instruct GPTQ Int4
其他
Falcon-H1是由TII开发的高性能混合架构语言模型,结合Transformers与Mamba架构,支持多语言任务。
大型语言模型
Transformers
F
tiiuae
191
1
Gemma 3 1b It Qat Bnb 4bit
Gemma 3是Google推出的轻量级开放模型系列,基于Gemini技术构建,支持多模态输入和文本输出。
图像生成文本
Transformers
G
unsloth
23
1
Qwen3 128k 30B A3B NEO MAX Imatrix Gguf
Apache-2.0
基于Qwen3-30B-A3B混合专家模型的GGUF量化版本,上下文扩展至128k,采用NEO Imatrix量化技术优化,支持多语言和多任务处理。
大型语言模型
支持多种语言
Q
DavidAU
17.20k
10
Qwen3 8B FP8 Dynamic
Apache-2.0
Qwen3-8B-FP8-dynamic是基于Qwen3-8B模型通过FP8量化优化的版本,显著降低了GPU内存需求和磁盘空间占用,同时保持了原始模型的性能。
大型语言模型
Transformers
Q
RedHatAI
81
1
Consilience 40b J4iA6BRm
Nous Consilience 40B 是一个400亿参数的生成式文本模型,通过去中心化方式从零开始预训练,支持多种语言,旨在代表人类广泛的创造性产出。
大型语言模型
Safetensors
支持多种语言
C
PsycheFoundation
46
1
Falcon H1 1.5B Deep Base
其他
Falcon-H1是由TII开发的高效混合架构语言模型,结合Transformer与Mamba架构,支持多语言任务
大型语言模型
Transformers
支持多种语言
F
tiiuae
194
3
Qwen3 0.6B Base
Apache-2.0
Qwen3是通义千问系列最新一代6亿参数大语言模型,支持32k上下文长度,覆盖119种语言
大型语言模型
Transformers
Q
Qwen
58.85k
44
GLM Z1 9B 0414 GGUF
MIT
GLM-Z1-9B-0414 是一个支持中英双语的文本生成模型,采用 GGUF 格式,适用于多种量化级别,从 BF16 到超低位量化(1-2 比特)。
大型语言模型
支持多种语言
G
Mungert
1,598
3
Xglm 564M
MIT
XGLM-564M 是一个多语言自回归语言模型,包含5.64亿参数,基于30种语言的平衡语料库训练,总计5000亿子词。
大型语言模型
支持多种语言
X
facebook
11.13k
51
Aya 23 8B
Aya-23是一个开放权重的指令微调模型研究版本,具有高度先进的多语言能力,支持23种语言。
大型语言模型
Transformers
支持多种语言
A
CohereLabs
10.28k
415
Elastic DeepSeek R1 Distill Qwen 7B
Apache-2.0
DeepSeek-R1-Distill-Qwen-7B 是一个基于 Qwen-7B 的蒸馏模型,支持多种语言,适用于文本生成任务。
大型语言模型
支持多种语言
E
TheStageAI
78
1
Elastic DeepSeek R1 Distill Llama 8B
Apache-2.0
由TheStage AI的ANNA生成的弹性模型,提供多种优化版本以适应不同场景需求,支持多语言文本生成。
大型语言模型
支持多种语言
E
TheStageAI
60
1
Gemma 3 12b It Qat Int4
Gemma 3是Google推出的轻量级开放模型系列,基于创建Gemini模型的研究和技术构建。
图像生成文本
Transformers
G
unsloth
78
1
Gemma 3 27b It Qat
Gemma是Google推出的轻量级开放模型系列,基于Gemini模型技术构建。
图像生成文本
Transformers
G
unsloth
168
2
Gemma 3 12b It Qat GGUF
Gemma是Google推出的轻量级先进开放模型系列,基于创建Gemini模型的技术构建。
文本生成图像
G
unsloth
4,943
5
Acip Qwen25 7b
Apache-2.0
ACIP项目提供的Qwen2.5-7B可压缩版本,支持动态调整压缩率并保持模型性能
大型语言模型
Transformers
英语
A
MerantixMomentum
80
2
Acip Llama31 8b
ACIP项目提供的可压缩版本Llama-3.1-8B模型,支持动态调整压缩率并保持性能
大型语言模型
Transformers
英语
A
MerantixMomentum
24
1
Elastic Llama 3.1 8B Instruct
Apache-2.0
Meta-Llama-3.1-8B-Instruct 的弹性优化版本,提供不同速度与精度的模型变体,适合自部署场景。
大型语言模型
E
TheStageAI
125
3
Llama 4 Scout 17B 16E Instruct FP8 Dynamic
其他
基于Llama-4构建的17B参数多语言指令模型,采用FP8量化优化,显著降低资源需求
图像生成文本
Safetensors
支持多种语言
L
RedHatAI
5,812
8
Gemma 3 27b It Qat Compressed Tensors
Gemma 3 是 Google 推出的轻量级先进开放模型系列,基于与 Gemini 模型相同的研究和技术构建。
图像生成文本
G
gaunernst
1,985
6
Gemma 3 12b It Qat Compressed Tensors
Gemma 3是Google推出的轻量级前沿开放模型家族,基于创建Gemini模型的相同研究与技术构建。
文本生成图像
G
gaunernst
867
1
Gemma 3 1b It Qat Q4 0 Unquantized
Gemma 3是Google推出的轻量级开源多模态模型系列,基于Gemini技术构建,支持文本和图像输入,生成文本输出。
图像生成文本
Transformers
G
google
246
4
GLM 4 32B Base 0414
MIT
GLM-4-32B-Base-0414是320亿参数规模的大语言模型,基于15T高质量数据预训练,支持中英双语,在代码生成、函数调用等任务表现优异。
大型语言模型
Transformers
支持多种语言
G
THUDM
995
21
GLM 4 9B 0414
MIT
GLM-4-9B-0414是GLM家族中的轻量级成员,拥有90亿参数规模,在数学推理和通用任务上展现出卓越能力,综合表现在同规模开源模型中名列前茅。
大型语言模型
Transformers
支持多种语言
G
THUDM
6,856
55
Gemma 3 12b It Qat Q4 0 GGUF
Gemma是谷歌推出的轻量级前沿开放模型系列,基于Gemini技术构建。
图像生成文本
G
Mungert
1,008
3
Gemma 3 4b It Qat Q4 0 GGUF
Gemma是谷歌推出的轻量级尖端开放模型家族,基于与Gemini模型相同的研究和技术构建。
文本生成图像
G
Mungert
713
2
Gemma 3 27b It Qat Autoawq
Gemma 3是Google推出的轻量级前沿开放模型系列,基于与Gemini相同技术构建,支持多模态输入(文本/图像)和文本输出。
图像生成文本
G
gaunernst
789
4
Meta Llama Llama 4 Maverick 17B 128E Instruct
其他
Llama 4 Maverick 是 Meta 发布的多模态 AI 模型,支持文本与图像理解,采用混合专家架构(MoE),在多语言文本和代码生成任务中表现优异。
多模态融合
Transformers
支持多种语言
M
Undi95
35
2
Elastic Mistral 7B Instruct V0.3
Apache-2.0
Mistral-7B-Instruct-v0.3是一个基于Mistral-7B的指令调优模型,支持多语言文本生成任务。
大型语言模型
E
TheStageAI
68
3
Gemma 3 27b It Int4 Gguf
Gemma 3是谷歌推出的轻量级尖端开放模型家族,基于与Gemini模型相同的研究技术构建。
图像生成文本
G
gaunernst
232
3
Gemma 3 12b It Int4 Gguf
Gemma 3是Google推出的轻量级多模态开放模型,支持文本和图像输入并生成文本输出,具有128K大上下文窗口和140+语言支持。
图像生成文本
G
gaunernst
107
1
Gams 9B Instruct GGUF
GaMS-9B-Instruct是基于Google Gemma 2系列开发的斯洛文尼亚语大语言模型,支持斯洛文尼亚语、英语及部分南斯拉夫语系语言。
大型语言模型
支持多种语言
G
tknez
81
2
EXAONE Deep 32B GGUF
其他
EXAONE-Deep-32B是一个32B参数的大语言模型,支持英语和韩语,专为文本生成任务设计。
大型语言模型
支持多种语言
E
Mungert
2,249
3
Gemma 3 27b Pt Qat Q4 0 Gguf
Gemma是谷歌推出的轻量级尖端开放模型家族,基于与Gemini模型相同的研究和技术构建。
图像生成文本
G
google
633
24
Gemma 3 27b It Qat Q4 0 Gguf
Gemma是Google推出的轻量级开源多模态模型系列,支持文本和图像输入并生成文本输出,具有128K大上下文窗口和超过140种语言支持。
图像生成文本
G
google
69.29k
251
Nemotron H 8B Base 8K
其他
NVIDIA Nemotron-H-8B-Base-8K 是由 NVIDIA 开发的大型语言模型(LLM),旨在为给定文本片段生成补全内容。
大型语言模型
Transformers
支持多种语言
N
nvidia
5,437
38
EXAONE Deep 7.8B GGUF
其他
采用IQ-DynamicGate技术的超低位量化(1-2比特)的7.8B参数模型,支持英语和韩语文本生成任务。
大型语言模型
支持多种语言
E
Mungert
1,791
5
Olmo2 11B SuperBPE T180k
Apache-2.0
110亿参数大语言模型,采用创新的SuperBPE分词器训练,支持超词单元识别和子词分词能力。
大型语言模型
Transformers
英语
O
UW
29
2
Gemma 3 12b It Int4 Awq
Gemma是谷歌推出的轻量级尖端开源模型家族,基于与Gemini模型相同的研究技术构建。
图像生成文本
Transformers
G
gaunernst
4,658
9
Gemma 3 12b Pt Unsloth Bnb 4bit
Gemma 3是谷歌推出的轻量级先进开放模型系列,基于与Gemini相同的研究技术构建,支持多模态输入和文本输出。
文本生成图像
Transformers
英语
G
unsloth
1,286
1