B

Biomedvlp BioViL T

由 microsoft 开发
BioViL-T是一个专注于分析胸部X光片和放射学报告的视觉语言模型,通过时序多模态预训练提升性能。
下载量 26.39k
发布时间 : 2/17/2023
模型介绍
内容详情
替代品

模型简介

BioViL-T是一个领域特定的视觉语言模型,专注于胸部X光片(CXRs)和放射学报告的分析。该模型采用时序多模态预训练方法,在图像和文本模态以及联合空间中嵌入时序信息,显著提升了多个下游任务的性能。

模型特点

时序多模态预训练
充分利用数据点之间的时序结构,在保持相同训练数据集的情况下提升下游任务性能。
跨模态对齐
利用[CLS]标记的潜在表征对齐文本和图像嵌入,实现更好的跨模态理解。
领域特定优化
专门针对胸部X光片和放射学报告领域进行优化,在相关任务上表现优异。
两阶段训练
语言模型先进行通用生物医学领域预训练,再进行放射学领域特定训练,提高专业性。

模型能力

胸部X光片分析
放射学报告理解
自然语言推理
短语定位
图像分类
文本分类
语言解码
跨模态检索

使用案例

医学影像分析
胸部X光片异常检测
分析胸部X光片并检测异常情况,如胸腔积液或气胸。
在MS-CXR-T基准测试上达到87.77%的准确率
放射学报告生成
根据胸部X光片生成或补充放射学报告。
医学研究
医学影像语言处理研究
支持AI研究人员探索临床NLP和VLP研究问题。