Llama 3.3 70B Instruct 4bit DWQ
基于Llama 3.3 70B指令微调模型的4位DWQ量化版本,适用于MLX框架的高效推理
大型语言模型
支持多种语言
L
mlx-community
140
2
M1ndb0t 0M3N Q4 K M GGUF
基于Qwen3-14B大语言模型的高性能GGUF转换版本,专为创造性推理、深层梦境逻辑、智能体交互和多语言指令优化
大型语言模型
英语
M
TheMindExpansionNetwork
18
1
Qwen3 30B A3B Quantized.w4a16
Apache-2.0
Qwen3-30B-A3B的INT4量化版本,通过权重量化减少75%的磁盘和GPU内存需求,保持高性能。
大型语言模型
Transformers

Q
RedHatAI
379
2
Qwen3 32B Quantized.w4a16
Apache-2.0
Qwen3-32B的INT4量化版本,通过权重量化减少75%的磁盘和GPU内存需求,保持高性能
大型语言模型
Transformers

Q
RedHatAI
2,213
5
Qwen3 30B A3B FP8 Dynamic
Apache-2.0
Qwen3-30B-A3B-FP8-dynamic是基于Qwen3-30B-A3B模型通过FP8量化优化的版本,显著降低了内存需求和计算成本,同时保持了原始模型的高准确率。
大型语言模型
Transformers

Q
RedHatAI
187
2
Qwen3 32B FP8 Dynamic
Apache-2.0
基于Qwen3-32B进行FP8动态量化的高效语言模型,显著降低内存需求并提升计算效率
大型语言模型
Transformers

Q
RedHatAI
917
8
Typhoon2.1 Gemma3 4b
泰语大语言模型(指令调优版),拥有40亿参数、128K上下文长度且具备函数调用能力
大型语言模型
T
scb10x
2,083
3
Qwen3 14B GPTQ Int4
Apache-2.0
Qwen3-4B是通义千问系列最新40亿参数大语言模型,支持思维模式与非思维模式切换,在推理、多语言和智能体任务中表现优异。
大型语言模型
Transformers

Q
JunHowie
640
2
Qwen3 4B
Apache-2.0
Qwen3-4B是通义千问系列大模型的最新版本,提供40亿参数的语言模型,支持思维与非思维模式切换,具备强大的推理、指令遵循和多语言能力。
大型语言模型
Transformers

Q
Qwen
307.26k
195
Qwen3 1.7B
Apache-2.0
Qwen3是通义千问系列最新一代大语言模型,提供完整的密集模型和专家混合(MoE)模型组合。
大型语言模型
Transformers

Q
Qwen
395.72k
113
Llama 3.2 3B Instruct GGUF
Llama-3.2-3B-Instruct GGUF是Meta发布的3B参数规模的大语言模型,采用IQ-DynamicGate技术进行超低位量化(1-2位),在保持内存效率的同时优化推理性能。
大型语言模型
支持多种语言
L
Mungert
656
3
Qwenphi 4 0.5b Draft
Apache-2.0
基于Qwen2.5-0.5B-Instruct构建,移植了microsoft/phi-4的词表,可作为Phi-4的草稿模型使用。
大型语言模型
Transformers

支持多种语言
Q
rdsm
27
4
Granite 3.2 2b Instruct GGUF
Apache-2.0
Granite-3.2-2B-Instruct是一个20亿参数的长上下文AI模型,专为思维推理能力微调。
大型语言模型
G
Mungert
754
3
Phi 4 Mini Instruct Abliterated
MIT
Phi-4-mini-instruct是基于合成数据和精选公开网站构建的轻量级开源模型,专注于高质量、强推理能力的数据。
大型语言模型
Transformers

支持多种语言
P
lunahr
250
8
Yulan Mini Instruct
MIT
YuLan-Mini-Instruct是一个24亿参数的紧凑但强大的文本生成模型,专注于数学和代码推理任务,支持中英文。
大型语言模型
Transformers

支持多种语言
Y
yulan-team
97
2
Phi 4 Mini Instruct
MIT
Phi-4-mini-instruct是一个轻量级开源模型,基于合成数据和过滤后的公开网站数据构建,专注于高质量、富含推理能力的数据。
大型语言模型
Transformers

支持多种语言
P
microsoft
346.30k
455
Llama 3.1 Sherkala 8B Chat
Sherkala是一款80亿参数的哈萨克语优先的多语言大语言模型,由G42旗下Inception与MBZUAI联合开发,支持哈萨克语、英语、俄语和土耳其语。
大型语言模型
支持多种语言
L
inceptionai
155
14
Chocolatine 2 14B Instruct V2.0.3
Apache-2.0
Chocolatine-2-14B-Instruct-v2.0.3 是一个基于 Qwen-2.5-14B 架构的大语言模型,经过 DPO 微调,专注于法语和英语任务,在法语 LLM 排行榜中表现优异。
大型语言模型
Transformers

支持多种语言
C
jpacifico
329
14
Phi 3 Medium 128k Instruct
MIT
Phi-3-Medium-128K-Instruct是一个拥有140亿参数的轻量级开源模型,专注于高质量与强推理能力,支持128K上下文长度。
大型语言模型
Transformers

其他
P
microsoft
17.52k
381
Home 3B V3 GGUF
其他
Home 3B v3是基于StableLM-3B-Zephyr微调的模型,专为家庭自动化控制设计,支持多语言和设备控制。
大型语言模型
支持多种语言
H
acon96
5,016
35
精选推荐AI模型
Llama 3 Typhoon V1.5x 8b Instruct
专为泰语设计的80亿参数指令模型,性能媲美GPT-3.5-turbo,优化了应用场景、检索增强生成、受限生成和推理任务
大型语言模型
Transformers

支持多种语言
L
scb10x
3,269
16
Cadet Tiny
Openrail
Cadet-Tiny是一个基于SODA数据集训练的超小型对话模型,专为边缘设备推理设计,体积仅为Cosmo-3B模型的2%左右。
对话系统
Transformers

英语
C
ToddGoldfarb
2,691
6
Roberta Base Chinese Extractive Qa
基于RoBERTa架构的中文抽取式问答模型,适用于从给定文本中提取答案的任务。
问答系统
中文
R
uer
2,694
98
AIbase是一个专注于MCP服务的平台,为AI开发者提供高质量的模型上下文协议服务,助力AI应用开发。
简体中文