Qwen3 0.6B GGUF
Apache-2.0
Qwen3-0.6B 是 Qwen 系列最新一代的 0.6B 参数规模的大语言模型,支持思维和非思维模式切换,具备强大的推理、指令遵循和多语言能力。
大型语言模型
Q
QuantFactory
317
1
Qwen3 1.7B GGUF
Apache-2.0
通义千问系列大语言模型的最新版本,支持思维与非思维模式切换,具备强大的推理、多语言和智能体能力。
大型语言模型
Q
Qwen
1,180
1
Falcon H1 0.5B Instruct
其他
猎鹰-H1是由TII开发的混合Transformers+Mamba架构的因果解码器专用语言模型,支持英语,性能卓越。
大型语言模型
Transformers

F
tiiuae
492
10
Qwen3 1.7B Unsloth Bnb 4bit
Apache-2.0
Qwen3-1.7B是通义千问系列最新一代大语言模型中的17亿参数版本,支持思维模式切换、多语言处理和智能体能力。
大型语言模型
Transformers

英语
Q
unsloth
40.77k
4
Qwen3 0.6B
Apache-2.0
Qwen3-0.6B是通义千问系列最新一代0.6B参数规模的大语言模型,支持思维与非思维模式切换,具备强大的推理、指令遵循和智能体能力。
大型语言模型
Transformers

Q
Qwen
497.09k
264
Openmath Nemotron 1.5B
OpenMath-Nemotron-1.5B是基于Qwen2.5-Math-1.5B在OpenMathReasoning数据集上微调的数学推理模型,在多个数学基准测试中取得最先进结果。
大型语言模型
Transformers

英语
O
nvidia
493
14
Colqwenstella 2b Multilingual
MIT
基于Qwen2视觉模型与stella_en_1.5B_v5结合的多语言视觉检索器,在Vidore基准测试中参数量≤20亿的模型中排名第一
文本生成图像
支持多种语言
C
Metric-AI
175
7
Conversation Summarizer V2
MIT
基于微调的 Llama 3.2 (3B) 的对话摘要模型,专门用于生成对话的简洁摘要。
文本生成
英语
C
dkp2701
17
1
Xinyuan VL 2B
Apache-2.0
Xinyuan-VL-2B 是赛灵格集团推出的面向终端侧的高性能多模态大模型,基于 Qwen/Qwen2-VL-2B-Instruct 微调而成,使用了超过500万条多模态数据及少量纯文本数据。
文本生成图像
Transformers

支持多种语言
X
Cylingo
94
7
Convai 9b
MIT
ConvAI-9b是一个拥有90亿参数的对话式AI模型,基于Zephyr-7b-beta和Mistral-7B-v0.2融合构建,适用于聊天机器人、虚拟助手等交互场景。
大型语言模型
Transformers

英语
C
CreitinGameplays
15
1
Towerinstruct Mistral 7B V0.2
基于Mistral架构的70亿参数多语言翻译模型,支持10种语言的翻译相关任务
大型语言模型
Transformers

支持多种语言
T
Unbabel
1,498
16
Codegemma 2b GGUF
CodeGemma是基于Gemma构建的轻量级开源代码模型系列,包含文本到文本和文本到代码的解码器模型,专精代码补全与生成任务。
大型语言模型
C
google
31
25
Minicpm 2B Dpo Bf16
MiniCPM是由面壁智能与清华大学自然语言处理实验室联合开源的一系列端侧大语言模型,核心语言模型MiniCPM-2B仅含24亿非词嵌入参数。
大型语言模型
Transformers

支持多种语言
M
openbmb
463
48
Proctora
Proctora是基于混合专家架构(MoE)的模型,结合了角色扮演和事实性回答的专家模块,支持32K上下文长度,在AI-RPG评估中表现优异。
大型语言模型
Transformers

P
Karko
78
5
精选推荐AI模型
Llama 3 Typhoon V1.5x 8b Instruct
专为泰语设计的80亿参数指令模型,性能媲美GPT-3.5-turbo,优化了应用场景、检索增强生成、受限生成和推理任务
大型语言模型
Transformers

支持多种语言
L
scb10x
3,269
16
Cadet Tiny
Openrail
Cadet-Tiny是一个基于SODA数据集训练的超小型对话模型,专为边缘设备推理设计,体积仅为Cosmo-3B模型的2%左右。
对话系统
Transformers

英语
C
ToddGoldfarb
2,691
6
Roberta Base Chinese Extractive Qa
基于RoBERTa架构的中文抽取式问答模型,适用于从给定文本中提取答案的任务。
问答系统
中文
R
uer
2,694
98
AIbase是一个专注于MCP服务的平台,为AI开发者提供高质量的模型上下文协议服务,助力AI应用开发。
简体中文