G

Gliner Large News V2.1

由 EmergentMethods 开发
基于GLiNER微调的新闻领域实体识别模型,擅长长文本新闻实体抽取,在18个基准数据集上零样本准确率最高提升7.5%。
下载量 2,558
发布时间 : 4/18/2024
模型介绍
内容详情
替代品

模型简介

该模型是针对新闻领域优化的实体识别模型,底层使用microsoft/deberta架构,通过合成数据微调提升跨领域主题的准确率。支持多种语言的翻译文本处理。

模型特点

跨领域性能提升
在18个基准数据集上零样本准确率较基础模型最高提升7.5%
新闻领域优化
特别针对长文本新闻实体抽取场景进行优化
全球视角数据
训练数据强制国家/语言/主题/时间多样性设计
高效推理
模型体积精巧,适合高吞吐生产环境

模型能力

新闻实体识别
多语言文本处理
零样本学习
长文本分析

使用案例

新闻分析
新闻事件实体抽取
从新闻报道中提取人物、地点、组织等关键实体
示例中展示了90%以上的关键实体识别准确率
跨语言新闻处理
处理翻译后的多语言新闻内容
支持11种语言的翻译文本处理
内容分析
事件关联分析
通过实体识别建立新闻事件间的关联
已在AskNews实体抽取系统中实际应用