C

CT M1 Complete SE

由 crisistransformers 开发
CrisisTransformers是面向危机相关社交媒体文本的预训练语言模型与句子编码器系列,基于RoBERTa架构,在150亿词标记的危机事件数据集上训练。
下载量 60
发布时间 : 9/11/2023
模型介绍
内容详情
替代品

模型简介

单语种(英语)句子编码器,可直接用于生成句子嵌入,支持语义搜索、聚类、主题建模等任务。

模型特点

危机文本优化
专门针对危机相关社交媒体文本训练,在疾病暴发、自然灾害等30多类危机事件数据上表现优异。
性能提升
在18个公开危机数据集上测试,最佳单语种编码器性能较现有技术提升超过17%。
即用型编码器
无需微调即可直接用于句子嵌入生成,支持下游应用快速部署。

模型能力

句子嵌入生成
语义相似度计算
文本聚类
主题建模

使用案例

危机响应
灾害信息分类
对灾害相关推文进行自动分类,识别求助、报告等信息类型。
在基准测试中分类准确率优于通用模型
多语言危机监测
通过多语言编码器实现跨语言危机信息监测与分析。
社交媒体分析
事件主题发现
从危机事件相关推文中自动发现和聚类关键主题。