超长上下文支持
INTELLECT 2 GGUF
Apache-2.0
INTELLECT 2是由PrimeIntellect推出的大语言模型,支持40960 tokens的上下文长度,采用QwQ架构和GRPO强化学习框架训练。
大型语言模型
I
lmstudio-community
467
5
Qwen3 4B AWQ
Apache-2.0
Qwen3-4B是通义千问系列最新一代40亿参数大语言模型,支持思维与非思维模式切换,具备强大的推理、指令遵循和智能体能力。
大型语言模型
Transformers
Q
Qwen
2,755
4
Qwen3 8B GGUF
Apache-2.0
Qwen3是通义千问系列大语言模型的最新迭代,提供稠密模型与混合专家(MoE)模型的完整套件。
大型语言模型
Q
Qwen
4,474
8
Qwen3 235B A22B AWQ
Apache-2.0
Qwen3-235B-A22B是Qwen系列最新一代的大语言模型,采用混合专家(MoE)架构,具有2350亿参数和220亿激活参数,在推理、指令遵循、代理能力和多语言支持方面表现卓越。
大型语言模型
Transformers
Q
cognitivecomputations
2,563
9
Qwen3 14B GGUF
Apache-2.0
Qwen3是通义千问系列大语言模型的最新版本,提供全系列的稠密模型与混合专家(MoE)模型,在推理能力、指令遵循、智能体功能和多语言支持方面实现重大突破。
大型语言模型
Q
Qwen
18.11k
28
Shuttle 3.5
Apache-2.0
Shuttle-3.5是基于Qwen3 32b微调的版本,模拟了Claude 3模型的写作风格,并全面训练了角色扮演数据。
大型语言模型
Transformers
英语
S
shuttleai
225
43
Qwen3 8B GGUF
Apache-2.0
Qwen3是通义千问系列最新一代大语言模型,提供完整的稠密模型与混合专家(MoE)模型套件。
大型语言模型
Transformers
Q
Mungert
1,931
7
Qwen3 32B GGUF
Apache-2.0
Qwen3-32B是由Qwen团队开发的大语言模型,支持131,072 tokens的上下文长度,具备强大的数学、编程和常识推理能力。
大型语言模型
Q
lmstudio-community
56.66k
7
Qwen3 30B A3B GGUF
Apache-2.0
Qwen3是阿里云开发的最新大语言模型系列,支持思维模式与非思维模式动态切换,在推理、多语言支持和智能体能力方面表现突出。
大型语言模型
英语
Q
unsloth
261.09k
169
Qwen3 14B GGUF
Qwen3-14B是由Qwen开发的大语言模型,支持多种语言和方言,擅长创意写作、角色扮演和多轮对话。
大型语言模型
Q
lmstudio-community
56.39k
9
Qwen3 4B FP8
Apache-2.0
Qwen3-4B-FP8是通义千问系列最新的大语言模型,提供40亿参数的FP8量化版本,支持思维与非思维模式切换,在推理、指令遵循和智能体能力方面表现卓越。
大型语言模型
Transformers
Q
Qwen
23.95k
22
Fluentlylm Prinum
MIT
流畅语言模型项目的首个独立模型,32.5B参数量的因果语言模型,支持多种语言和任务。
大型语言模型
Transformers
支持多种语言
F
fluently-lm
241
28
Internlm2 1 8b
其他
InternLM2-1.8B是第二代书生·浦语系列的18亿参数版本,具有高质量和高适应灵活性的基础模型,支持长达20万字符的超长上下文。
大型语言模型
Transformers
I
internlm
7,980
32
Internlm2 7b
其他
InternLM2-7B是第二代书生·浦语模型系列中的7B参数规模版本,具有强大的通用语言能力和特定领域优化。
大型语言模型
Transformers
I
internlm
8,327
42