S

Sciroshot

由 BSC-LT 开发
基于RoBERTa-large的零样本文本分类模型,专为科学领域优化,在跨领域任务中表现优异
下载量 83
发布时间 : 2/8/2023
模型介绍
内容详情
替代品

模型简介

通过微软学术图谱(MAG)科学论文数据微调的零样本分类模型,采用蕴含关系方法实现高效文本分类

模型特点

科学领域优化
使用微软学术图谱科学论文数据微调,在科学分类任务中达到最先进性能
跨领域泛化
虽针对科学领域优化,但在通用领域分类任务中仍表现优异
蕴含关系方法
创新性地将分类任务转化为文本与标签的蕴含关系判断
高效训练策略
通过早停法防止过拟合,显著提升零样本分类性能

模型能力

零样本文本分类
多标签分类
科学文献分类
跨领域文本分类

使用案例

学术研究
科学论文分类
自动将科研论文分类到292个科学领域类别
在arXiv数据集上达到42.22%准确率
文献检索增强
改进学术搜索引擎的文献分类和推荐功能
内容管理
新闻分类
对新闻文章进行多主题自动分类
在雅虎问答主题分类上达到59.08%准确率
社交媒体内容分析
识别社交媒体帖子的话题类别