G

Gliner Poly Small V1.0

由 knowledgator 开发
GLiNER 是一个灵活的命名实体识别(NER)模型,能够识别任何实体类型,为传统 NER 模型和大型语言模型提供了实用替代方案。
下载量 18
发布时间 : 8/19/2024
模型介绍
内容详情
替代品

模型简介

GLiNER 是一个命名实体识别(NER)模型,通过双向 Transformer 编码器识别任何实体类型。相比传统 NER 模型仅限于预定义实体,GLiNER 更加灵活,同时比大型语言模型(LLMs)更轻量且成本更低。

模型特点

灵活识别任何实体类型
GLiNER 能够识别任何实体类型,而不仅限于预定义的实体集合。
双编码器架构
采用后融合的双编码器架构,文本编码器为 DeBERTa v3 small,实体标签编码器为 BGE-small-en,提高了对标签间关系的理解能力。
高效推理
若实体嵌入已预处理,推理速度更快;可一次性识别无限数量的实体。
泛化能力强
对未见实体的泛化能力更强,适合处理多样化的实体类型。

模型能力

命名实体识别
多语言支持
高效推理
灵活实体识别

使用案例

信息提取
人物与事件提取
从文本中提取人物、日期、奖项、赛事和球队等实体。
如示例中所示,模型能够准确识别出克里斯蒂亚诺·罗纳尔多、1985年2月5日、金球奖等实体。
社交媒体分析
推文实体识别
从社交媒体推文中提取实体,用于趋势分析或内容分类。
在基准测试中,模型在 Broad Tweet Corpus 数据集上取得了 70.2% 的得分。
生物医学文本分析
医学实体识别
从生物医学文献中提取疾病、药物等实体。
在 bc5cdr 数据集上取得了 60.5% 的得分。