Qwen3 0.6B Llamafile
Apache-2.0
Qwen3是Qwen系列最新一代的大语言模型,提供0.6B参数的密集模型,在推理、指令遵循、代理能力和多语言支持方面有突破性进展。
大型语言模型
Q
Mozilla
250
1
Qwen3 4B GGUF
Apache-2.0
Qwen3-4B是通义千问系列大语言模型的最新版本,具有4B参数规模,支持思维与非思维模式切换,擅长推理、指令遵循和多语言处理。
大型语言模型
Q
QuantFactory
341
1
Qwen3 0.6B GGUF
Apache-2.0
Qwen3-0.6B 是 Qwen 系列最新一代的 0.6B 参数规模的大语言模型,支持思维和非思维模式切换,具备强大的推理、指令遵循和多语言能力。
大型语言模型
Q
QuantFactory
317
1
Falcon H1 34B Instruct GPTQ Int8
其他
猎鹰-H1是由TII开发的高性能混合架构语言模型,结合了Transformers和Mamba架构的优势,支持英语和多语言任务。
大型语言模型
Transformers

F
tiiuae
105
3
Qwen3 30B A3B GGUF
Apache-2.0
Qwen3是Qwen系列最新一代的大语言模型,提供了一系列密集和混合专家(MoE)模型,在推理、指令遵循、代理能力和多语言支持方面取得了突破性进展。
大型语言模型
英语
Q
eaddario
371
2
Qwen3 235B A22B GPTQ Int4
Apache-2.0
Qwen3是Qwen系列最新一代的大语言模型,提供了一系列密集和混合专家(MoE)模型。
大型语言模型
Transformers

Q
Qwen
1,563
9
Qwen3 235B A22B
Apache-2.0
Qwen3 是 Qwen 系列最新一代的大语言模型,提供了一系列密集和混合专家(MoE)模型。
大型语言模型
Transformers

Q
unsloth
421
2
Qwen3 1.7B GPTQ Int8
Apache-2.0
Qwen3是通义千问系列大语言模型的最新版本,提供17亿参数的GPTQ 8位量化模型,支持思维与非思维模式切换,增强推理能力和多语言支持。
大型语言模型
Transformers

Q
Qwen
635
1
Qwen3 1.7B GGUF
Apache-2.0
通义千问系列大语言模型的最新版本,支持思维与非思维模式切换,具备强大的推理、多语言和智能体能力。
大型语言模型
Q
Qwen
1,180
1
Qwen3 4B GGUF
Apache-2.0
Qwen3是通义千问系列大语言模型的最新版本,提供了一系列密集型和混合专家(MoE)模型。
大型语言模型
Q
Qwen
4,225
6
Qwen3 235B A22B AWQ
Apache-2.0
Qwen3-235B-A22B是Qwen系列最新一代的大语言模型,采用混合专家(MoE)架构,具有2350亿参数和220亿激活参数,在推理、指令遵循、代理能力和多语言支持方面表现卓越。
大型语言模型
Transformers

Q
cognitivecomputations
2,563
9
Falcon H1 7B Instruct
其他
Falcon-H1是由TII开发的高效混合架构语言模型,结合Transformers与Mamba架构优势,支持英语及多语言任务。
大型语言模型
Transformers

F
tiiuae
4,246
7
Falcon H1 3B Instruct
其他
猎鹰-H1是由TII开发的混合Transformers+Mamba架构的因果解码器专用语言模型,支持英语和多语言任务。
大型语言模型
Transformers

F
tiiuae
380
4
Falcon H1 1.5B Deep Instruct
其他
猎鹰-H1是由阿联酋技术创新研究院开发的混合Transformer与曼巴架构的因果解码器模型,支持英语和多语种任务。
大型语言模型
Transformers

F
tiiuae
987
10
Falcon H1 1.5B Instruct
其他
猎鹰-H1是由TII开发的高效混合架构语言模型,结合了Transformers和Mamba架构的优势,支持英语和多语言任务。
大型语言模型
Transformers

F
tiiuae
1,022
4
Falcon H1 7B Base
其他
Falcon-H1是由TII开发的混合Transformers + Mamba架构的因果解码器专用语言模型,支持多语言处理,性能优异。
大型语言模型
Transformers

支持多种语言
F
tiiuae
227
1
Falcon H1 1.5B Base
其他
Falcon-H1是由TII开发的混合Transformers + Mamba架构的仅解码因果模型,支持英语和多语言任务。
大型语言模型
Transformers

支持多种语言
F
tiiuae
454
2
Qwen3 14B 128K GGUF
Apache-2.0
Qwen3是Qwen系列最新一代的大语言模型,提供了一系列密集和混合专家(MoE)模型。
大型语言模型
英语
Q
unsloth
10.20k
13
Qwen3 30B A3B 128K GGUF
Apache-2.0
Qwen3是通义千问系列最新一代大语言模型,提供完整的稠密与混合专家(MoE)模型体系。
大型语言模型
英语
Q
unsloth
48.68k
43
Qwen3 32B 128K GGUF
Apache-2.0
Qwen3是Qwen系列最新一代的大语言模型,提供了一系列密集和混合专家(MoE)模型。
大型语言模型
英语
Q
unsloth
20.51k
20
Qwen3 8B 128K GGUF
Apache-2.0
Qwen3是通义千问系列大语言模型的最新8B参数版本,支持思维与非思维模式切换,具备128K上下文长度和卓越的多语言能力。
大型语言模型
英语
Q
unsloth
15.29k
14
Qwen3 235B A22B 128K GGUF
Apache-2.0
Qwen3是通义千问系列最新一代大语言模型,提供完整的稠密和混合专家(MoE)模型套件。
大型语言模型
英语
Q
unsloth
310.66k
26
Qwen3 235B A22B GGUF
Apache-2.0
Qwen3是Qwen系列最新一代的大语言模型,提供了一系列密集和混合专家(MoE)模型。
大型语言模型
英语
Q
unsloth
75.02k
48
Qwen3 8B GGUF
Apache-2.0
Qwen3是Qwen系列最新一代的大语言模型,提供了一系列密集和混合专家(MoE)模型。
大型语言模型
英语
Q
unsloth
64.32k
39
Qwen3 30B A3B FP8
Apache-2.0
Qwen3是通义千问系列最新一代大语言模型,提供稠密模型和混合专家(MoE)模型的完整套件。
大型语言模型
Transformers

Q
Qwen
107.85k
57
Qwen3 4B 128K GGUF
Apache-2.0
Qwen3-4B是Qwen系列最新一代的大语言模型,具有4B参数规模,支持100多种语言,在推理、指令遵循、代理能力和多语言支持方面表现优异。
大型语言模型
英语
Q
unsloth
15.41k
17
Qwen3 4B FP8
Apache-2.0
Qwen3-4B-FP8是通义千问系列最新的大语言模型,提供40亿参数的FP8量化版本,支持思维与非思维模式切换,在推理、指令遵循和智能体能力方面表现卓越。
大型语言模型
Transformers

Q
Qwen
23.95k
22
Qwen3 1.7B Unsloth Bnb 4bit
Apache-2.0
Qwen3-1.7B是通义千问系列最新一代大语言模型中的17亿参数版本,支持思维模式切换、多语言处理和智能体能力。
大型语言模型
Transformers

英语
Q
unsloth
40.77k
4
Qwen3 1.7B GGUF
Apache-2.0
Qwen3-1.7B是Qwen系列最新一代1.7B参数规模的大语言模型,支持在思考与非思考模式间切换,具备增强的推理能力和多语言支持。
大型语言模型
英语
Q
unsloth
28.55k
16
Qwen3 0.6B Unsloth Bnb 4bit
Apache-2.0
Qwen3是Qwen系列最新一代的大语言模型,提供了一套全面的密集和混合专家(MoE)模型。
大型语言模型
Transformers

英语
Q
unsloth
50.36k
7
Qwen3 0.6B GGUF
Apache-2.0
Qwen3-0.6B是阿里云开发的0.6B参数规模的大语言模型,属于Qwen3系列的最新成员,支持100多种语言,具备强大的推理、指令遵循和多语言能力。
大型语言模型
英语
Q
unsloth
53.56k
41
Qwen3 14B Unsloth Bnb 4bit
Apache-2.0
Qwen3是通义千问系列最新一代大语言模型,提供全系列稠密模型和混合专家(MoE)模型。
大型语言模型
Transformers

英语
Q
unsloth
68.67k
5
Qwen3 14B GGUF
Apache-2.0
Qwen3是阿里云开发的最新大语言模型,具有强大的推理、指令遵循和多语言支持能力,支持思考与非思考模式切换。
大型语言模型
英语
Q
unsloth
81.29k
40
Qwen3 32B Unsloth Bnb 4bit
Apache-2.0
Qwen3是通义千问系列大语言模型的最新版本,提供32.8B参数的密集模型,在推理能力、指令遵循、智能体功能和多语言支持方面实现突破性进展。
大型语言模型
Transformers

英语
Q
unsloth
10.03k
5
Qwen3 32B GGUF
Apache-2.0
Qwen3是阿里云开发的大规模语言模型系列的最新版本,具有卓越的推理、指令跟随和多语言支持能力。
大型语言模型
英语
Q
unsloth
123.35k
57
Qwen3 4B Unsloth Bnb 4bit
Apache-2.0
Qwen3-4B是Qwen系列最新一代的大语言模型,具有4B参数规模,支持100多种语言,在推理、指令跟随和代理能力方面表现突出。
大型语言模型
Transformers

英语
Q
unsloth
72.86k
5
Qwen3 4B GGUF
Apache-2.0
Qwen3-4B是Qwen系列最新一代的大语言模型,具有4B参数规模,支持100多种语言,具备卓越的推理、指令遵循和代理能力。
大型语言模型
英语
Q
unsloth
59.40k
32
EXAONE Deep 2.4B GGUF
其他
EXAONE Deep是由LG AI Research开发的高效推理语言模型,参数规模2.4B,在数学和编程等推理任务中表现优异。
大型语言模型
支持多种语言
E
Mungert
968
3
Qwen 2.5 7B Reasoning
MIT
基于Qwen/Qwen2.5-7B-Instruct微调的版本,专门针对高级推理任务进行了优化
大型语言模型
Transformers

英语
Q
HyperX-Sen
70
3
Reasonablellama3 3B Jr
基于LLaMA-3B构建的微调推理模型,增强推理能力,支持多语言处理
大型语言模型
支持多种语言
R
adeelahmad
1,173
6
- 1
- 2
精选推荐AI模型
Llama 3 Typhoon V1.5x 8b Instruct
专为泰语设计的80亿参数指令模型,性能媲美GPT-3.5-turbo,优化了应用场景、检索增强生成、受限生成和推理任务
大型语言模型
Transformers

支持多种语言
L
scb10x
3,269
16
Cadet Tiny
Openrail
Cadet-Tiny是一个基于SODA数据集训练的超小型对话模型,专为边缘设备推理设计,体积仅为Cosmo-3B模型的2%左右。
对话系统
Transformers

英语
C
ToddGoldfarb
2,691
6
Roberta Base Chinese Extractive Qa
基于RoBERTa架构的中文抽取式问答模型,适用于从给定文本中提取答案的任务。
问答系统
中文
R
uer
2,694
98
AIbase是一个专注于MCP服务的平台,为AI开发者提供高质量的模型上下文协议服务,助力AI应用开发。
简体中文