T

TITAN

由 MahmoodLab 开发
TITAN是一个多模态全切片基础模型,通过视觉自监督学习和视觉-语言对齐进行预训练,用于病理学图像分析。
下载量 213.39k
发布时间 : 12/2/2024
模型介绍
内容详情
替代品

模型简介

TITAN是一个预训练的视觉-语言编码器,专门用于病理学全切片图像的特征提取和多模态对齐。它整合了335,645张全切片图像和大量病理报告数据,在多样化下游任务中表现出色。

模型特点

多模态预训练
整合了视觉自监督学习和视觉-语言对齐,同时处理图像和文本数据
大规模数据集
使用了335,645张涵盖多种病理类型的全切片图像和大量病理报告数据
多样化应用能力
支持线性探测、少样本和零样本分类、罕见癌症检索、跨模态检索等多种任务
高性能表现
在多种下游任务中实现了最先进的性能

模型能力

病理图像特征提取
病理图像分类
跨模态检索
病理报告生成
罕见癌症识别
零样本学习

使用案例

医学诊断
肿瘤分类
对病理切片进行肿瘤类型分类
在多种癌症类型分类任务中表现优异
罕见癌症识别
识别罕见类型的癌症
在罕见癌症检索任务中表现突出
医学研究
病理报告生成
根据病理图像生成描述性报告
能够生成准确的病理描述
跨模态检索
根据文本描述检索相关病理图像
实现了高效的图像-文本匹配