Cogito 14b Gptq Q4
Apache-2.0
基于Qwen2.5-14B大语言模型的GPTQ量化版本,支持英语和西班牙语文本生成任务
大型语言模型
Transformers

C
mediainbox
8,547
2
Qwen3 30B A1.5B 64K High Speed NEO Imatrix MAX Gguf
基于Qwen3-30B-A3B专家混合模型的优化版本,通过减少激活专家数量提升速度,支持64k上下文长度,适用于多种文本生成任务。
大型语言模型
支持多种语言
Q
DavidAU
508
3
Qwen3 128k 30B A3B NEO MAX Imatrix Gguf
Apache-2.0
基于Qwen3-30B-A3B混合专家模型的GGUF量化版本,上下文扩展至128k,采用NEO Imatrix量化技术优化,支持多语言和多任务处理。
大型语言模型
支持多种语言
Q
DavidAU
17.20k
10
Llama 4 Scout 17B 16E Instruct Bnb 4bit
其他
这是原始模型 meta-llama/Llama-4-Scout-17B-16E-Instruct 的量化版本,采用 int4 量化技术优化,适用于多语言任务。
大型语言模型
Transformers

支持多种语言
L
bnb-community
1,286
1
Doge 320M
Apache-2.0
Doge是一个采用动态掩码注意力机制进行序列转换的模型,可使用多层感知器或跨域专家混合进行状态转换。
大型语言模型
Transformers

支持多种语言
D
SmallDoge
3,028
4
Nvidia Llama 3.1 Nemotron 70B Instruct HF AWQ INT4
这是 NVIDIA 基于 Meta Llama-3.1-70B-Instruct 定制的 Llama-3.1-Nemotron-70B-Instruct 模型的 AWQ 4位量化版本,专注于提升生成响应的有用性。
大型语言模型
Transformers

支持多种语言
N
ibnzterrell
206
5
Jamba Hercules
Apache-2.0
Jamba-Hercules是基于ai21labs/Jamba-v0.1微调的大语言模型,使用Locutusque/hercules-v4.0数据集进行训练,专注于文本生成任务。
大型语言模型
Transformers

J
Severian
24
13
Kunoichi DPO V2 7B GGUF Imatrix
基于Mistral架构的7B参数大语言模型,采用DPO(直接偏好优化)训练,在多项基准测试中表现优异
大型语言模型
K
Lewdiculous
3,705
39
Maral 7B Alpha 1
MIT
Maral是一款专注于波斯语的大型语言模型,基于Mistral架构,在波斯语Alpaca数据集上训练而成,同时支持英语生成。
大型语言模型
Transformers

支持多种语言
M
MaralGPT
54
54
Genz 70b
GenZ 是基于 Meta 开源 Llama V2 700 亿参数模型微调的先进大语言模型,旨在为开源社区提供高性能的文本生成能力。
大型语言模型
Transformers

英语
G
budecosystem
1,556
31
精选推荐AI模型
Llama 3 Typhoon V1.5x 8b Instruct
专为泰语设计的80亿参数指令模型,性能媲美GPT-3.5-turbo,优化了应用场景、检索增强生成、受限生成和推理任务
大型语言模型
Transformers

支持多种语言
L
scb10x
3,269
16
Cadet Tiny
Openrail
Cadet-Tiny是一个基于SODA数据集训练的超小型对话模型,专为边缘设备推理设计,体积仅为Cosmo-3B模型的2%左右。
对话系统
Transformers

英语
C
ToddGoldfarb
2,691
6
Roberta Base Chinese Extractive Qa
基于RoBERTa架构的中文抽取式问答模型,适用于从给定文本中提取答案的任务。
问答系统
中文
R
uer
2,694
98
AIbase是一个专注于MCP服务的平台,为AI开发者提供高质量的模型上下文协议服务,助力AI应用开发。
简体中文