T

Twitter Roberta Base Dec2021 Tweetner7 Continuous

由 tner 开发
该模型是基于RoBERTa架构的Twitter专用命名实体识别模型,在tweetner7数据集上持续微调,用于识别推文中的命名实体。
下载量 20
发布时间 : 7/3/2022
模型介绍
内容详情
替代品

模型简介

该模型专门用于识别Twitter推文中的命名实体,包括人物、地点、组织等类别。通过连续微调优化了在社交媒体文本上的表现。

模型特点

Twitter文本优化
专门针对Twitter文本特点进行优化,能有效处理社交媒体特有的表达方式和格式
连续微调策略
采用先在2020年数据上微调,再在2021年数据上持续微调的两阶段训练策略
多类别实体识别
能识别7类实体:公司、创意作品、事件、团体、地点、人物和产品

模型能力

Twitter文本命名实体识别
社交媒体文本处理
多类别实体分类

使用案例

社交媒体分析
推文实体提取
从Twitter推文中提取人物、地点、组织等实体信息
F1分数达到0.65
社交媒体监控
监测社交媒体中特定实体(如品牌、名人)的提及情况
数据标注
自动标注工具
为社交媒体文本分析提供预标注服务