R

RS M CLIP

由 joaodaniel 开发
面向遥感领域的多语言视觉-语言预训练模型,支持10种语言的图像-文本跨模态任务
下载量 248
发布时间 : 11/5/2024
模型介绍
内容详情
替代品

模型简介

RS-M-CLIP是基于CLIP架构的改进模型,专门针对遥感图像处理优化,通过整合多语言翻译数据和自蒸馏方法提升性能。支持跨模态检索、零样本图像分类等任务。

模型特点

多语言支持
支持10种语言的文本输入,包括主要欧洲和亚洲语言
遥感领域优化
专门针对卫星/航拍图像特性进行训练,在遥感任务中表现优异
自蒸馏训练
采用对齐局部和全局表示的自监督方法提升模型性能

模型能力

多语言图像分类
跨模态图像检索
多语言文本检索
零样本学习

使用案例

地理空间分析
卫星图像分类
对卫星图像进行零样本分类,如识别飞机、建筑物等目标
在示例中准确识别出飞机图像
多语言图像检索
使用不同语言查询检索相关遥感图像
支持10种语言的查询输入
城市规划
土地利用分析
识别城市区域、绿地等土地利用类型