Moondream 2b 2025 04 14 4bit
Apache-2.0
Moondream是一款轻量级视觉语言模型,专为高效全平台运行而设计。
图像生成文本
Safetensors
M
moondream
6,037
38
Falcon E 3B Base
其他
Falcon-E是由TII开发的1.58比特量化语言模型,采用纯Transformer架构,专为高效推理设计
大型语言模型
Transformers

F
tiiuae
51
6
Phi 4 Mini Instruct Float8dq
MIT
Phi-4-mini-instruct模型经torchao进行float8动态激活和权重量化,在H100上实现36%显存降低和15-20%速度提升,几乎不影响精度。
大型语言模型
Transformers

其他
P
pytorch
1,006
1
Qwen2.5 VL 7B Instruct GPTQ Int4
Apache-2.0
Qwen2.5-VL-7B-Instruct-GPTQ-Int4是基于Qwen2.5-VL-7B-Instruct模型进行非官方GPTQ-Int4量化的版本,支持图文到文本的多模态任务。
图像生成文本
Transformers

支持多种语言
Q
hfl
872
3
Llama 3 2 3B SFT GGUF
MIT
基于Llama-3.2-3B预训练模型的指令微调版本,采用4比特量化和LoRA技术进行高效微调
大型语言模型
英语
L
SURESHBEEKHANI
53
1
Flux.1 Lite 8B
其他
Flux.1 Lite是从FLUX.1-dev模型蒸馏而来的80亿参数Transformer模型,减少了7GB内存占用,运行速度提升23%,同时保持原始模型精度。
文本生成图像
F
Freepik
11.17k
59
Llama 3.2 3B Instruct FP8 Dynamic
Llama-3.2-3B-Instruct的FP8量化版本,适用于多语言的商业和研究用途,特别适合类似助手的聊天场景。
大型语言模型
Safetensors
支持多种语言
L
RedHatAI
986
3
Pixtral 12b Nf4
Apache-2.0
基于Mistral社区Pixtral-12B的4位量化版本,专注于图像文本到文本任务,支持中文描述生成
图像生成文本
Transformers

P
SeanScripts
236
20
Madlad400 10b Mt Gguf
Apache-2.0
MADLAD-400-10B-MT 是一个多语言翻译模型,支持多种语言之间的翻译任务。
机器翻译
M
thirteenbit
163
5
Taiwan Tinyllama V1.0 Chat
Apache-2.0
这是专为繁体中文优化的Tinyllama持续预训练版本,基于TinyLlama-1.1B模型,持续预训练数据集包含约20亿个词元。
大型语言模型
Transformers

中文
T
DavidLanz
31
3
Bloom 1b4 Zh
Openrail
基于bigscience/bloom-1b7架构开发的中文语言模型,参数规模14亿,通过压缩词表降低显存占用
大型语言模型
Transformers

中文
B
Langboat
5,157
18
精选推荐AI模型
Llama 3 Typhoon V1.5x 8b Instruct
专为泰语设计的80亿参数指令模型,性能媲美GPT-3.5-turbo,优化了应用场景、检索增强生成、受限生成和推理任务
大型语言模型
Transformers

支持多种语言
L
scb10x
3,269
16
Cadet Tiny
Openrail
Cadet-Tiny是一个基于SODA数据集训练的超小型对话模型,专为边缘设备推理设计,体积仅为Cosmo-3B模型的2%左右。
对话系统
Transformers

英语
C
ToddGoldfarb
2,691
6
Roberta Base Chinese Extractive Qa
基于RoBERTa架构的中文抽取式问答模型,适用于从给定文本中提取答案的任务。
问答系统
中文
R
uer
2,694
98
AIbase是一个专注于MCP服务的平台,为AI开发者提供高质量的模型上下文协议服务,助力AI应用开发。
简体中文