library_name: transformers
tags:
- resnet
- SAR
- 雷达
- 光学遥感
- 骨干网络
- 海洋
- 风场
- 哨兵1号
license: apache-2.0
pipeline_tag: 图像特征提取
OceanSAR-1模型卡
模型详情
模型描述
OceanSAR-1是OceanSAR系列首个基础模型,专为合成孔径雷达(SAR)图像分析设计,聚焦海洋观测。该模型采用创新的动态数据集剪枝策略进行训练,提升了训练效率和特征质量。
- 开发团队: Thomas Kerdreux, Alexandre Tuel @ Galeio
- 部署团队: Antoine Audras @ Galeio
- 模型类型: 视觉基础模型(ResNet50/ViT变体)
- 许可协议: Apache 2.0许可证
- 训练数据: 哨兵1号波浪模式(WV)SAR图像(2015-2024)
- 训练机制: 采用动态数据集剪枝的DINO自监督学习
用途
直接使用
本模型可作为SAR图像特征提取器,特别适用于海洋观测任务:
下游应用
已在三个下游任务验证效果:
- TenGeoP分类:SAR图像中10种地球物理现象分类
- 有效波高估算:海浪高度预测回归任务
- 风速预测:海面风速估算回归任务
使用方式
import torch
from transformers import AutoModel
model = AutoModel.from_pretrained("galeio-research/OceanSAR-1")
dummy_image = torch.randn(1, 1, 256, 256)
with torch.no_grad():
outputs = model(dummy_image)
features = outputs.pooler_output
训练详情
训练数据
- 数据集: 哨兵1号波浪模式SAR图像
- 时间跨度: 2015-2024
- 规模: 约1200万张图像
- 预处理:
- 空间降采样至50米分辨率
- 动态数据集剪枝保证多样性与平衡性
- 验证集图像排除在训练集外
动态数据集剪枝
创新性动态剪枝策略实现:
- 最大化数据集多样性与平衡性
- 降低计算成本
- 提升下游任务表现
- 无需预训练特征提取器
评估
性能表现
在下游任务(线性探测)达到先进水平:
-
TenGeoP分类:
- ResNet50: 75.5%准确率
- ViT-S/16: 78.6%准确率
- ViT-S/8: 82.1%准确率
- ViT-B/8: 83.6%准确率
-
有效波高估算:
-
风速预测:
- RMSE: 1.37-1.43米/秒(因架构而异)
商业部署或获取针对特定需求的优化模型变体,欢迎联系讨论授权与支持方案。
技术规格
硬件要求
依赖项
- PyTorch >= 1.8.0
- Transformers >= 4.30.0
- torchvision >= 0.9.0
输入规格
- 输入尺寸: 256x256像素
- 单通道(VV极化)
- 归一化像素值
- 哨兵1号波浪模式SAR图像
引用
BibTeX:
@article{kerdreux2025efficientselfsupervisedlearningearth,
title={基于动态数据集优化的对地观测高效自监督学习},
author={Kerdreux, Thomas and Tuel, Alexandre and Febvre, Quentin and Mouche, Alexis and Chapron, Bertrand},
journal={arXiv预印本 arXiv:2504.06962},
year={2025},
eprint={2504.06962},
archivePrefix={arXiv},
primaryClass={cs.CV},
url={https://arxiv.org/abs/2504.06962},
}
致谢
本研究使用GENCI分配的IDRIS和TGCC超算资源(分配号2025-[A0171015666])。