R

Ru Patents Ner

由 Delicalib 开发
这是一个基于spaCy框架的俄语专利命名实体识别模型,专注于识别专利文本中的特定实体类型。
下载量 37
发布时间 : 3/16/2025
模型介绍
内容详情
替代品

模型简介

该模型主要用于处理俄语专利文本,能够识别和分类专利中的系统、组件和属性三类实体。

模型特点

专利文本优化
专门针对俄语专利文本训练,在专利领域具有较好的实体识别能力
多类别识别
能够识别专利文本中的系统(SYSTEM)、组件(COMPONENT)和属性(ATTRIBUTE)三类实体
spaCy集成
基于流行的spaCy框架构建,便于集成到现有NLP流程中

模型能力

俄语文本处理
专利实体识别
多类别实体分类

使用案例

知识产权分析
专利信息提取
从俄语专利文档中自动提取关键系统、组件和属性信息
F1值达到60.66%
专利数据库构建
自动化处理大量俄语专利文本,构建结构化专利数据库