低资源推理优化
Cogito 14b Gptq Q4
Apache-2.0
基于Qwen2.5-14B大语言模型的GPTQ量化版本,支持英语和西班牙语文本生成任务
大型语言模型
Transformers
C
mediainbox
8,547
2
Qwen3 30B A1.5B 64K High Speed NEO Imatrix MAX Gguf
基于Qwen3-30B-A3B专家混合模型的优化版本,通过减少激活专家数量提升速度,支持64k上下文长度,适用于多种文本生成任务。
大型语言模型
支持多种语言
Q
DavidAU
508
3
Qwen3 128k 30B A3B NEO MAX Imatrix Gguf
Apache-2.0
基于Qwen3-30B-A3B混合专家模型的GGUF量化版本,上下文扩展至128k,采用NEO Imatrix量化技术优化,支持多语言和多任务处理。
大型语言模型
支持多种语言
Q
DavidAU
17.20k
10
Llama 4 Scout 17B 16E Instruct Bnb 4bit
其他
这是原始模型 meta-llama/Llama-4-Scout-17B-16E-Instruct 的量化版本,采用 int4 量化技术优化,适用于多语言任务。
大型语言模型
Transformers
支持多种语言
L
bnb-community
1,286
1
Doge 320M
Apache-2.0
Doge是一个采用动态掩码注意力机制进行序列转换的模型,可使用多层感知器或跨域专家混合进行状态转换。
大型语言模型
Transformers
支持多种语言
D
SmallDoge
3,028
4
Nvidia Llama 3.1 Nemotron 70B Instruct HF AWQ INT4
这是 NVIDIA 基于 Meta Llama-3.1-70B-Instruct 定制的 Llama-3.1-Nemotron-70B-Instruct 模型的 AWQ 4位量化版本,专注于提升生成响应的有用性。
大型语言模型
Transformers
支持多种语言
N
ibnzterrell
206
5
Jamba Hercules
Apache-2.0
Jamba-Hercules是基于ai21labs/Jamba-v0.1微调的大语言模型,使用Locutusque/hercules-v4.0数据集进行训练,专注于文本生成任务。
大型语言模型
Transformers
J
Severian
24
13
Kunoichi DPO V2 7B GGUF Imatrix
基于Mistral架构的7B参数大语言模型,采用DPO(直接偏好优化)训练,在多项基准测试中表现优异
大型语言模型
K
Lewdiculous
3,705
39
Maral 7B Alpha 1
MIT
Maral是一款专注于波斯语的大型语言模型,基于Mistral架构,在波斯语Alpaca数据集上训练而成,同时支持英语生成。
大型语言模型
Transformers
支持多种语言
M
MaralGPT
54
54
Genz 70b
GenZ 是基于 Meta 开源 Llama V2 700 亿参数模型微调的先进大语言模型,旨在为开源社区提供高性能的文本生成能力。
大型语言模型
Transformers
英语
G
budecosystem
1,556
31