DAM 3B Self Contained
其他
DAM-3B是一个能够根据用户指定的图像区域(点/框/涂鸦/掩码)生成精细化局部描述的视觉语言模型。
图像生成文本
英语
D
nvidia
824
17
Gemma 3 4b It Abliterated Q4 0 GGUF
该模型是mlabonne/gemma-3-4b-it-abliterated的GGUF格式转换版本,结合了x-ray_alpha的视觉组件,提供更流畅的多模态体验。
图像生成文本
G
BernTheCreator
160
1
STEVE R1 7B SFT GGUF
Apache-2.0
STEVE-R1-7B-SFT的静态量化版本,支持多种量化级别,适用于不同硬件需求
文本生成图像
英语
S
mradermacher
203
0
Diagram To Code Agent
Apache-2.0
该模型是一个视觉语言融合模型,专门用于将图表转换为结构化代码。
图像生成文本
Safetensors
英语
D
DiagramAgent
51
0
Colpali V1.3
MIT
ColPali是基于PaliGemma-3B与ColBERT策略的视觉检索模型,用于高效索引文档的视觉特征
文本生成图像
英语
C
vidore
96.60k
40
Colpali
MIT
ColPali是基于PaliGemma-3B与ColBERT策略的视觉检索模型,用于高效地从视觉特征索引文档。
文本生成图像
英语
C
vidore
12.88k
436
Mmalaya
Apache-2.0
MMAlaya是基于大语言模型Alaya开发的多模态系统,包含大语言模型、图像文本特征编码器和特征转换模块三大核心组件。
图像生成文本
Transformers

M
DataCanvas
31
1
Llava Plus V0 7b
LLaVA-Plus 是一个可插拔学习技能的大型语言与视觉助手,主要用于多模态模型及聊天机器人的学术研究。
文本生成图像
Transformers

L
LLaVA-VL
79
38
Llava V1.5 13b Lora
LLaVA 是一个开源的多模态聊天机器人,通过对 LLaMA/Vicuna 进行微调,并基于 GPT 生成的多模态指令跟随数据训练而成。
文本生成图像
Transformers

L
liuhaotian
143
26
Llava Lightning 7B Delta V1 1
Apache-2.0
LLaVA是基于LLaMA/Vicuna通过GPT生成的多模态指令跟随数据微调的开源聊天机器人
文本生成图像
Transformers

L
liuhaotian
699
21
精选推荐AI模型
Llama 3 Typhoon V1.5x 8b Instruct
专为泰语设计的80亿参数指令模型,性能媲美GPT-3.5-turbo,优化了应用场景、检索增强生成、受限生成和推理任务
大型语言模型
Transformers

支持多种语言
L
scb10x
3,269
16
Cadet Tiny
Openrail
Cadet-Tiny是一个基于SODA数据集训练的超小型对话模型,专为边缘设备推理设计,体积仅为Cosmo-3B模型的2%左右。
对话系统
Transformers

英语
C
ToddGoldfarb
2,691
6
Roberta Base Chinese Extractive Qa
基于RoBERTa架构的中文抽取式问答模型,适用于从给定文本中提取答案的任务。
问答系统
中文
R
uer
2,694
98
AIbase是一个专注于MCP服务的平台,为AI开发者提供高质量的模型上下文协议服务,助力AI应用开发。
简体中文