复杂任务处理
Qwen3 30B A6B 16 Extreme 128k Context
基于千问3-30B-A3B的混合专家模型微调版本,激活专家数提升至16,上下文窗口扩展至128k,适合复杂推理场景
大型语言模型
Transformers
Q
DavidAU
72
7
THUDM GLM 4 32B 0414 6.5bpw H8 Exl2
MIT
GLM-4-32B-0414是GLM家族的新成员,参数规模达320亿,性能与GPT系列相当,支持本地部署。
大型语言模型
Transformers
支持多种语言
T
LatentWanderer
148
2
GLM 4 32B 0414 Unsloth Bnb 4bit
MIT
GLM-4-32B-0414是GLM家族的新成员,拥有320亿参数,性能媲美GPT系列和DeepSeek系列,支持本地部署。
大型语言模型
Transformers
支持多种语言
G
unsloth
87
2
GLM 4 32B 0414 GGUF
MIT
GLM-4-32B-0414是拥有320亿参数的大语言模型,性能媲美GPT-4o和DeepSeek-V3,支持中文和英语,具备卓越的代码生成、函数调用和复杂任务处理能力。
大型语言模型
支持多种语言
G
unsloth
4,680
10
GLM 4 32B 0414
MIT
GLM-4-32B-0414是拥有320亿参数规模的大语言模型,性能与GPT系列相当,支持中英文,擅长代码生成、函数调用和复杂任务处理。
大型语言模型
Transformers
支持多种语言
G
THUDM
10.91k
320
Community Request 02 12B
基于多个12B参数规模的大语言模型融合而成,具备文本生成和对话能力
大型语言模型
Transformers
C
Nitral-AI
53
4
Community Request 01 12B
基于多个Captain-Eris系列模型通过mergekit工具合并的预训练语言模型
大型语言模型
Transformers
C
Nitral-AI
19
3
Reflection Llama 3.1 70B
Reflection Llama-3.1 70B 是一款开源大语言模型,采用'反思调优'技术训练,能够自主检测推理错误并修正方向。
大型语言模型
Transformers
R
mattshumer
199
1,712
Badger Lambda Llama 3 8b
Badger是通过递归最大成对不相交归一化去噪傅里叶插值方法生成的Llama3 8B指令模型,融合了多个优秀模型的特性。
大型语言模型
Transformers
B
maldv
24
11
Microsoft WizardLM 2 7B
Apache-2.0
WizardLM-2 7B是微软AI团队开发的高效大语言模型,基于Mistral-7B架构,在多语言、推理和代理任务上表现优异。
大型语言模型
Transformers
M
lucyknada
168
51
Kunoichi DPO V2 7B
Kunoichi-DPO-v2-7B是基于Mistral架构的7B参数大语言模型,采用DPO(Direct Preference Optimization)优化训练,在多项基准测试中表现优异。
大型语言模型
Transformers
K
SanjiWatsuki
185
86
CAMEL 33B Combined Data
CAMEL-33B是基于LLaMA-33B微调的大语言模型,整合了CAMEL框架对话数据、ShareGPT公开对话和Alpaca指令数据,擅长多轮对话和指令理解。
大型语言模型
Transformers
C
camel-ai
97
6
Tulu 65b
Tulu 65B是基于多指令数据集微调的65B参数LLaMa模型,是开放资源指令调优研究的成果,综合性能强劲。
大型语言模型
Transformers
英语
T
allenai
20
21