T

Tr Core News Md

由 turkish-nlp-suite 开发
针对土耳其语优化的中等规模spaCy管道,包含分词、词性标注、形态分析、依存句法分析和命名实体识别功能
下载量 85
发布时间 : 11/3/2022
模型介绍
内容详情
替代品

模型简介

该模型是TrSpaCy项目的一部分,专门为土耳其语设计,提供全面的自然语言处理功能,包括词性标注、形态分析、依存句法分析和命名实体识别。

模型特点

全面的土耳其语支持
专门为土耳其语设计和优化,处理土耳其语特有的形态和句法特征
多任务处理能力
单一管道同时处理分词、词性标注、形态分析、依存句法分析和命名实体识别
高精度标注
在词性标注(UPOS)上达到90.52%的准确率,命名实体识别F值达到88.94%
预训练词向量
包含50000个唯一词向量(300维),基于Medium-sized Turkish Floret word vectors

模型能力

土耳其语分词
词性标注
形态分析
词形还原
依存句法分析
命名实体识别
句子边界检测

使用案例

文本处理
土耳其语文本标注
自动标注土耳其语文本的词性、形态特征和句法结构
可用于构建土耳其语语言资源或预处理文本
信息提取
从土耳其语文本中提取命名实体(人名、地名、组织名等)
NER F值达到88.94%
语言学研究
土耳其语形态分析
分析土耳其语复杂的形态结构
形态特征准确率88.93%