S

Science Keyword Classification

由 nasa-impact 开发
基于INDUS模型微调,用于对NASA通用元数据存储库中的科学关键词进行分类,提升地球观测元数据的可访问性和组织性。
下载量 131
发布时间 : 10/11/2024

模型简介

该模型在极端多标签分类环境下工作,能够处理大量潜在标签并应对标签频率不平衡问题,通过预测相关关键词来优化NASA地球观测元数据的组织。

模型特点

极端多标签分类
能够处理大量潜在标签(关键词)的分类问题,并且可以应对标签频率不平衡的情况。
分层数据拆分
数据集基于provider-id进行拆分,确保训练集、验证集和测试集之间的平衡表示。
优化的焦点损失
使用焦点损失(γ=2)替代交叉熵损失,通过关注难以分类的样本来解决标签不平衡问题,显著提升性能指标。

模型能力

科学关键词分类
极端多标签预测
元数据组织优化

使用案例

地球观测数据管理
NASA元数据关键词自动标注
为NASA通用元数据存储库中的科学数据自动分配相关关键词
提高元数据的可发现性和组织效率
AIbase
智启未来,您的人工智能解决方案智库
简体中文