32K长上下文
Qwen3 1.7B GGUF
Apache-2.0
Qwen3是通义千问系列大语言模型的最新代际,提供稠密和混合专家(MoE)模型的全面套件。
大型语言模型
Q
QuantFactory
333
1
Opencodereasoning Nemotron 14B GGUF
Apache-2.0
OpenCodeReasoning-Nemotron-14B 是基于 Qwen2.5-14B-Instruct 进行后训练的大型语言模型,专为代码生成推理优化,支持32K tokens上下文长度。
大型语言模型
支持多种语言
O
Mungert
507
1
Opencodereasoning Nemotron 32B GGUF
Apache-2.0
OpenCodeReasoning-Nemotron-32B 是基于 Qwen2.5-32B-Instruct 的代码生成推理模型,支持32K tokens上下文长度,适用于商业和非商业用途。
大型语言模型
支持多种语言
O
Mungert
633
1
Opencodereasoning Nemotron 32B IOI
Apache-2.0
OpenCodeReasoning-Nemotron-32B-IOI 是一个基于 Qwen2.5-32B-Instruct 的大型语言模型,专门针对代码生成任务进行了推理后训练,支持 32K token 的上下文长度。
大型语言模型
Transformers
支持多种语言
O
nvidia
152
20
Qwen3 0.6B FP8
Apache-2.0
Qwen3-0.6B-FP8是通义千问系列大语言模型的最新版本,提供0.6B参数的FP8量化版本,支持思维模式自由切换和多种语言任务。
大型语言模型
Transformers
Q
Qwen
5,576
43
Seed Coder 8B Base
MIT
Seed-Coder是一个8B规模的开源代码模型家族,包含基础版、指令版和推理版,专注于代码生成和补全任务。
大型语言模型
Transformers
S
ByteDance-Seed
1,837
41
Qwen3 1.7B
Apache-2.0
Qwen3是通义千问系列最新一代大语言模型,提供完整的密集模型和专家混合(MoE)模型组合。
大型语言模型
Transformers
Q
Qwen
395.72k
113
Opencodereasoning Nemotron 32B
Apache-2.0
OpenCodeReasoning-Nemotron-32B 是一个基于 Qwen2.5-32B-Instruct 的大型语言模型,专门针对代码生成推理能力进行训练,支持 32K token 的上下文长度,可自由用于商业/非商业用途。
大型语言模型
Transformers
支持多种语言
O
nvidia
1,176
64
Opencodereasoning Nemotron 14B
Apache-2.0
OpenCodeReasoning-Nemotron-14B 是一个专为代码生成推理而进行后训练的大型语言模型,支持32K令牌的上下文长度。
大型语言模型
Transformers
支持多种语言
O
nvidia
247
18
Opencodereasoning Nemotron 7B
Apache-2.0
OpenCodeReasoning-Nemotron-7B 是基于 Qwen2.5-7B-Instruct 开发的大型语言模型,专注于代码生成和推理任务,支持 32K tokens 的上下文长度。
大型语言模型
Transformers
支持多种语言
O
nvidia
5,410
30
Lucie 7B Instruct V1.1
Apache-2.0
基于Lucie-7B微调的多语言因果语言模型,支持法语和英语,专注于指令跟随和文本生成任务。
大型语言模型
支持多种语言
L
OpenLLM-France
13.33k
9
Dbrx Instruct
其他
Databricks开发的专家混合(MoE)大语言模型,专精于少量轮次交互场景
大型语言模型
Transformers
D
databricks
5,005
1,112
Proctora
Proctora是基于混合专家架构(MoE)的模型,结合了角色扮演和事实性回答的专家模块,支持32K上下文长度,在AI-RPG评估中表现优异。
大型语言模型
Transformers
P
Karko
78
5
Llama 2 7B 32K
基于Meta原版Llama-2 7B模型微调的开源长上下文语言模型,支持32K上下文长度
大型语言模型
Transformers
英语
L
togethercomputer
5,411
538