多模态医学分析
Chinese LLaVA Med 7B
Apache-2.0
基于LLaVA-1.5架构的中文医疗多模态大语言模型,专注于医疗领域的视觉问答任务。
文本生成图像
Transformers
中文
C
BUAADreamer
60
4
Medgemma 4b It
其他
MedGemma是Google开发的医疗专用多模态AI模型,基于Gemma 3架构,专注于医学文本和图像理解。
图像生成文本
Transformers
M
unsloth
223
2
Medgemma 4b It
其他
MedGemma是基于Gemma 3优化的医学多模态模型系列,专为医学文本和图像理解设计,提供4B和27B两种参数规模版本。
图像生成文本
Transformers
M
google
15.36k
259
Llama 3.2 11B Vision Radiology Mini
Apache-2.0
基于unsloth/Llama-3.2-11B-Vision-Instruct微调的放射影像辅助解读模型,优化后运行速度提升两倍
图像生成文本
Transformers
英语
L
0llheaven
885
1
Radllama 7b
RadLLaMA-7b是斯坦福AIMI团队开发的针对放射学领域的基础语言模型,基于LLaMA2架构。
大型语言模型
Transformers
R
StanfordAIMI
82.89k
2
Llava Roco 8bit
BabyDoctor是一个多模态大语言模型,融合了CLiP和LLaMA 2的能力,能够理解和生成文本,同时理解图像。
图像生成文本
Transformers
英语
L
photonmz
29
15
Rclip
Gpl-3.0
RCLIP是基于CLIP模型在放射影像领域微调的视觉-语言模型,专为医学影像分析优化。
文本生成图像
Transformers
英语
R
kaveh
42
2
Quiltnet B 16 PMB
MIT
基于Quilt-1M病理视频数据集训练的ViT-B/16视觉编码器与PubMedBERT文本编码器多模态基础模型
图像生成文本
Q
wisdomik
513
5
Quiltnet B 32
MIT
基于Quilt-1M病理视频数据集训练的CLIP ViT-B/32视觉语言基础模型,专为病理组织学分析设计
文本生成图像
Q
wisdomik
8,442
22