X

Xlm Roberta Large Ner Kazakh

由 yeshpanovrustem 开发
基于XLM-RoBERTa-large架构的哈萨克语命名实体识别模型,在KazNERD数据集上训练,支持多种实体类型识别
下载量 99
发布时间 : 5/19/2023
模型介绍
内容详情
替代品

模型简介

该模型专门用于哈萨克语文本中的命名实体识别任务,能够识别地理位置、人名、组织名等多种实体类型

模型特点

高精度哈萨克语NER
在验证集和测试集上F1值均超过96%,表现优异
多类别实体识别
支持识别谚语、艺术品、基数词、联系方式、日期等多种实体类型
基于KazNERD数据集
使用经过清洗的哈萨克语命名实体识别数据集训练,数据质量高

模型能力

哈萨克语文本处理
命名实体识别
序列标注

使用案例

文本分析
新闻文本分析
从哈萨克语新闻中提取关键实体信息
可准确识别地理位置、人名等关键信息
商业文档处理
分析哈萨克斯坦与欧盟贸易文档中的关键数据
能识别金额、日期等关键商业实体
学术研究
哈萨克语语言学研究
支持哈萨克语语言结构和实体分布研究