标签:
- spacy
- 标记分类
语言:
- 日语
许可证: cc-by-sa-4.0
模型索引:
- 名称: ja_core_news_sm
结果:
- 任务:
名称: 命名实体识别
类型: 标记分类
指标:
- 名称: NER精确率
类型: 精确率
值: 0.7109375
- 名称: NER召回率
类型: 召回率
值: 0.572327044
- 名称: NER F值
类型: f值
值: 0.6341463415
- 任务:
名称: 词性标注
类型: 标记分类
指标:
- 名称: 词性标注(XPOS)准确率
类型: 准确率
值: 0.9713282143
- 任务:
名称: 词性标注
类型: 标记分类
指标:
- 名称: 词性标注(UPOS)准确率
类型: 准确率
值: 0.9612599714
- 任务:
名称: 形态分析
类型: 标记分类
指标:
- 名称: 形态特征(UFeats)准确率
类型: 准确率
值: 0.0
- 任务:
名称: 词形还原
类型: 标记分类
指标:
- 名称: 词形还原准确率
类型: 准确率
值: 0.9670499959
- 任务:
名称: 无标记依存关系
类型: 标记分类
指标:
- 名称: 无标记依存分数(UAS)
类型: f值
值: 0.9195153808
- 任务:
名称: 有标记依存关系
类型: 标记分类
指标:
- 名称: 有标记依存分数(LAS)
类型: f值
值: 0.9047554776
- 任务:
名称: 句子分割
类型: 标记分类
指标:
- 名称: 句子F值
类型: f值
值: 0.9832841691
详情: https://spacy.io/models/ja#ja_core_news_sm
针对CPU优化的日语处理流程。组件包括: tok2vec, morphologizer, parser, senter, ner, attribute_ruler。
特性 |
描述 |
名称 |
ja_core_news_sm |
版本 |
3.7.0 |
spaCy |
>=3.7.0,<3.8.0 |
默认流程 |
tok2vec , morphologizer , parser , attribute_ruler , ner |
组件 |
tok2vec , morphologizer , parser , senter , attribute_ruler , ner |
向量 |
0键, 0独特向量(0维) |
数据源 |
UD日语GSD v2.8 (大村麻衣; 宮尾祐介; 金山博; 松田浩; 若狭彩; 山下佳代; 浅原正幸; 田中孝明; 村脇有吾; 松本裕治; 森信介; 上松すみれ; Ryan McDonald; Joakim Nivre; Daniel Zeman) UD日语GSD v2.8 NER (Megagon Labs东京) |
许可证 |
CC BY-SA 4.0 |
作者 |
Explosion |
标签体系
查看标签体系(3个组件的65个标签)
组件 |
标签 |
morphologizer |
词性=名词 , 词性=助词 , 词性=动词 , 词性=从属连词 , 词性=助动词 , 词性=标点 , 词性=小品词 , 词性=限定词 , 词性=数词 , 词性=副词 , 词性=代词 , 词性=形容词 , 词性=专有名词 , 词性=并列连词 , 词性=符号 , 词性=名词|极性=否定 , 词性=助动词|极性=否定 , 词性=空格 , 词性=感叹词 , 词性=从属连词|极性=否定 |
parser |
根节点 , 形容词性从句 , 状语从句 , 状语 , 形容词修饰 , 助词 , 格标记 , 并列连词 , 补语从句 , 复合词 , 系词 , 主语从句 , 依赖 , 限定词 , 错位 , 固定搭配 , 标记 , 名词修饰 , 名词主语 , 数词修饰 , 宾语 , 旁格 , 标点 |
ner |
基数词 , 日期 , 事件 , 设施 , 地理政治实体 , 语言 , 法律 , 地点 , 货币 , 运动 , 民族/宗教/政治团体 , 序数词 , 组织 , 百分比 , 人名 , 宠物名 , 电话 , 产品 , 数量 , 时间 , 头衔后缀 , 艺术品 |
准确率
类型 |
得分 |
标记准确率 |
99.37 |
标记精确率 |
97.64 |
标记召回率 |
97.88 |
标记F值 |
97.76 |
词性标注准确率 |
96.13 |
形态分析准确率 |
0.00 |
形态分析微平均精确率 |
34.01 |
形态分析微平均召回率 |
98.04 |
形态分析微平均F值 |
50.51 |
句子分割精确率 |
98.04 |
句子分割召回率 |
98.62 |
句子分割F值 |
98.33 |
无标记依存分数 |
91.95 |
有标记依存分数 |
90.48 |
词性标注准确率 |
97.13 |
词形还原准确率 |
96.70 |
实体识别精确率 |
71.09 |
实体识别召回率 |
57.23 |
实体识别F值 |
63.41 |