超长上下文
Qwen3 14B AWQ
Apache-2.0
Qwen3-14B-AWQ是通义千问系列最新一代大语言模型的4-bit AWQ量化版本,支持思维模式与非思维模式无缝切换,具备强大的推理、指令遵循和智能体能力。
大型语言模型
Transformers
Q
Qwen
15.17k
21
Qwen3 30B A3B 128K GGUF
Apache-2.0
Qwen3是通义千问系列最新一代大语言模型,提供完整的稠密与混合专家(MoE)模型体系。
大型语言模型
英语
Q
unsloth
48.68k
43
Qwen3 4B GGUF
Qwen3-4B是由Qwen开发的大语言模型,支持131,072 tokens的上下文长度,擅长创意写作、角色扮演和多轮对话。
大型语言模型
Q
lmstudio-community
26.16k
8
Qwen3 235B A22B GGUF
Apache-2.0
Qwen3是Qwen系列最新一代的大语言模型,提供了一系列密集和混合专家(MoE)模型。
大型语言模型
英语
Q
unsloth
75.02k
48
Qwen3 30B A3B
Apache-2.0
Qwen3是通义千问系列大语言模型的最新版本,提供完整的稠密模型与混合专家(MoE)模型组合。
大型语言模型
Transformers
Q
Qwen
218.81k
571
Llama 4 Maverick 17B 128E Instruct
其他
Llama 4 Maverick是Meta推出的170亿参数多模态AI模型,采用混合专家架构(MoE),支持多语言文本和图像理解,具备128个专家模块。
大型语言模型
Transformers
支持多种语言
L
meta-llama
87.79k
309
Sambalingo Japanese Chat
基于Llama2架构的多语言对话模型,支持日语和英语,训练数据包含ultrachat、ultrafeedback和harmless对话数据集
大型语言模型
Transformers
支持多种语言
S
sambanovasystems
32
34