模型介绍
内容详情
替代品
模型简介
这是一个中等大小的荷兰语处理模型,基于spaCy框架开发,适用于各种荷兰语文本处理任务。模型包含完整的自然语言处理流程,能够执行分词、词性标注、依存分析、命名实体识别等任务。
模型特点
CPU优化
专门针对CPU使用进行了优化,适合在没有GPU的环境中部署
全面NLP流程
包含完整的自然语言处理组件,从分词到命名实体识别一应俱全
预训练向量
包含20000个300维的预训练词向量,提升语义理解能力
模型能力
荷兰语分词
词性标注
依存句法分析
命名实体识别
词形还原
句子分割
形态分析
使用案例
文本分析
荷兰语文本预处理
为荷兰语文本分析任务提供预处理功能
准确率高达96.39%(UPOS词性标注)
信息提取
从荷兰语文本中提取命名实体(人物、地点、组织等)
F1值75.28%
语言学研究
荷兰语语法分析
分析荷兰语句子的语法结构和依存关系
依存分析UAS 86.82%,LAS 82.13%
标签:
- spacy
- 标记分类 语言:
- 荷兰语 许可证: cc-by-sa-4.0 模型索引:
- 名称: nl_core_news_md
结果:
- 任务:
名称: 命名实体识别
类型: 标记分类
指标:
- 名称: NER精确率 类型: 精确率 值: 0.7668579627
- 名称: NER召回率 类型: 召回率 值: 0.7392807746
- 名称: NER F值 类型: f值 值: 0.7528169014
- 任务:
名称: 词性标注
类型: 标记分类
指标:
- 名称: 词性标注(XPOS)准确率 类型: 准确率 值: 0.9498800436
- 任务:
名称: 词性标注
类型: 标记分类
指标:
- 名称: 词性标注(UPOS)准确率 类型: 准确率 值: 0.9639258451
- 任务:
名称: 形态分析
类型: 标记分类
指标:
- 名称: 形态特征(UFeats)准确率 类型: 准确率 值: 0.9606282037
- 任务:
名称: 词形还原
类型: 标记分类
指标:
- 名称: 词形还原准确率 类型: 准确率 值: 0.9542272717
- 任务:
名称: 无标记依存关系
类型: 标记分类
指标:
- 名称: 无标记依存分数(UAS) 类型: f值 值: 0.8682209833
- 任务:
名称: 有标记依存关系
类型: 标记分类
指标:
- 名称: 有标记依存分数(LAS) 类型: f值 值: 0.8213380639
- 任务:
名称: 句子分割
类型: 标记分类
指标:
- 名称: 句子F值 类型: f值 值: 0.8684303351
- 任务:
名称: 命名实体识别
类型: 标记分类
指标:
详情: https://spacy.io/models/nl#nl_core_news_md
针对CPU优化的荷兰语处理流程。组件包括: tok2vec, morphologizer, tagger, parser, lemmatizer (trainable_lemmatizer), senter, ner.
特性 | 描述 |
---|---|
名称 | nl_core_news_md |
版本 | 3.7.0 |
spaCy | >=3.7.0,<3.8.0 |
默认流程 | tok2vec , morphologizer , tagger , parser , lemmatizer , attribute_ruler , ner |
组件 | tok2vec , morphologizer , tagger , parser , lemmatizer , senter , attribute_ruler , ner |
向量 | 500000键, 20000唯一向量(300维) |
来源 | UD荷兰语LassySmall v2.8 (Bouma, Gosse; van Noord, Gertjan) 荷兰语NER标注UD LassySmall (NLP Town) UD荷兰语Alpino v2.8 (Zeman, Daniel; Žabokrtský, Zdeněk; Bouma, Gosse; van Noord, Gertjan) Explosion fastText向量(cbow, OSCAR Common Crawl + Wikipedia) (Explosion) |
许可证 | CC BY-SA 4.0 |
作者 | Explosion |
标签方案
查看标签方案(4个组件的323个标签)
组件 | 标签 |
---|---|
morphologizer |
POS=PRON|Person=3|PronType=Dem , Number=Sing|POS=AUX|Tense=Pres|VerbForm=Fin , POS=ADV , POS=VERB|VerbForm=Part , POS=PUNCT , Number=Sing|POS=AUX|Tense=Past|VerbForm=Fin , POS=ADP , POS=NUM , Number=Plur|POS=NOUN , POS=VERB|VerbForm=Inf , POS=SCONJ , Definite=Def|POS=DET , Gender=Com|Number=Sing|POS=NOUN , Number=Sing|POS=VERB|Tense=Pres|VerbForm=Fin , Degree=Pos|POS=ADJ , Gender=Neut|Number=Sing|POS=PROPN , Gender=Com|Number=Sing|POS=PROPN , POS=AUX|VerbForm=Inf , Number=Sing|POS=VERB|Tense=Past|VerbForm=Fin , POS=DET , Gender=Neut|Number=Sing|POS=NOUN , POS=PRON|Person=3|PronType=Prs , POS=CCONJ , Number=Plur|POS=VERB|Tense=Pres|VerbForm=Fin , POS=PRON|Person=3|PronType=Ind , Degree=Cmp|POS=ADJ , Case=Nom|POS=PRON|Person=1|PronType=Prs , Definite=Ind|POS=DET , Case=Nom|POS=PRON|Person=3|PronType=Prs , POS=PRON|Person=3|Poss=Yes|PronType=Prs , Number=Plur|POS=AUX|Tense=Pres|VerbForm=Fin , POS=PRON|PronType=Rel , Case=Acc|POS=PRON|Person=1|PronType=Prs , Number=Plur|POS=VERB|Tense=Past|VerbForm=Fin , Gender=Com,Neut|Number=Sing|POS=NOUN , Case=Acc|POS=PRON|Person=3|PronType=Prs|Reflex=Yes , Case=Acc|POS=PRON|Person=3|PronType=Prs , POS=PROPN , POS=PRON|PronType=Ind , POS=PRON|Person=3|PronType=Int , Case=Acc|POS=PRON|PronType=Rcp , Number=Plur|POS=AUX|Tense=Past|VerbForm=Fin , Number=Sing|POS=NOUN , POS=PRON|Person=1|Poss=Yes|PronType=Prs , POS=SYM , Abbr=Yes|POS=X , Gender=Com,Neut|Number=Sing|POS=PROPN , Degree=Sup|POS=ADJ , POS=ADJ , Number=Sing|POS=PROPN , POS=PRON|PronType=Dem , POS=AUX|VerbForm=Part , POS=SPACE , POS=PRON|Person=3|PronType=Rel , Number=Plur|POS=PROPN , POS=PRON|Person=2|Poss=Yes|PronType=Prs , Case=Dat|POS=PRON|PronType=Dem , Case=Nom|POS=PRON|Person=2|PronType=Prs , POS=INTJ , Case=Acc|POS=PRON|Person=2|PronType=Prs , Case=Gen|POS=PRON|Person=3|Poss=Yes|PronType=Prs , POS=PRON|PronType=Int , POS=PRON|Person=2|PronType=Prs , POS=PRON|Person=3 , Case=Gen|POS=PRON|Person=2|PronType=Prs , POS=X |
tagger |
ADJ|nom|basis|met-e|mv-n , ADJ|nom|basis|met-e|zonder-n|bijz , ADJ|nom|basis|met-e|zonder-n|stan , ADJ|nom|basis|zonder|mv-n , ADJ|nom|basis|zonder|zonder-n , ADJ|nom|comp|met-e|mv-n , ADJ|nom|comp|met-e|zonder-n|stan , ADJ|nom|sup|met-e|mv-n , ADJ|nom|sup|met-e|zonder-n|bijz , ADJ|nom|sup|met-e|zonder-n|stan , ADJ|nom|sup|zonder|zonder-n , ADJ|postnom|basis|met-s , ADJ|postnom|basis|zonder , ADJ|postnom|comp|met-s , ADJ|prenom|basis|met-e|bijz , ADJ|prenom|basis|met-e|stan , ADJ|prenom|basis|zonder , ADJ|prenom|comp|met-e|stan , ADJ|prenom|comp|zonder , ADJ|prenom|sup|met-e|stan , ADJ|prenom|sup|zonder , ADJ|vrij|basis|zonder , ADJ|vrij|comp|zonder , ADJ|vrij|dim|zonder , ADJ|vrij|sup|zonder , BW , LET , LID|bep|dat|evmo , LID|bep|gen|evmo , LID|bep|gen|rest3 , LID|bep|stan|evon , LID|bep|stan|rest , LID|onbep|stan|agr , N|eigen|ev|basis|gen , N|eigen|ev|basis|genus|stan , N|eigen|ev|basis|onz|stan , N|eigen|ev|basis|zijd|stan , N|eigen|ev|dim|onz|stan , N|eigen|mv|basis , N|soort|ev|basis|dat , N|soort|ev|basis|gen , N|soort|ev|basis|genus|stan , N|soort|ev|basis|onz|stan , N|soort|ev|basis|zijd|stan , N|soort|ev|dim|onz|stan , N|soort|mv|basis , N|soort|mv|dim , SPEC|afgebr , SPEC|afk , SPEC|deeleigen , SPEC|enof , SPEC|meta , SPEC|symb , SPEC|vreemd , TSW , TW|hoofd|nom|mv-n|basis , TW|hoofd|nom|mv-n|dim , TW|hoofd|nom|zonder-n|basis , TW|hoofd|nom|zonder-n|dim , TW|hoofd|prenom|stan , TW|hoofd|vrij , TW|rang|nom|mv-n , TW|rang|nom|zonder-n , TW|rang|prenom|stan , VG|neven , VG|onder , VNW|aanw|adv-pron|obl|vol|3o|getal , VNW|aanw|adv-pron|stan|red|3|getal , VNW|aanw|det|dat|nom|met-e|zonder-n , VNW|aanw|det|dat|prenom|met-e|evmo , VNW|aanw|det|gen|prenom|met-e|rest3 , VNW|aanw|det|stan|nom|met-e|mv-n , VNW|aanw|det|stan|nom|met-e|zonder-n , VNW|aanw|det|stan|prenom|met-e|rest , VNW|aanw|det|stan|prenom|zonder|agr , VNW|aanw|det|stan|prenom|zonder|evon , VNW|aanw|det|stan|prenom|zonder|rest , VNW|aanw|det|stan|vrij|zonder , VNW|aanw|pron|gen|vol|3m|ev , VNW|aanw|pron|stan|vol|3o|ev , VNW|aanw|pron|stan|vol|3|getal , VNW|betr|det|stan|nom|met-e|zonder-n , VNW|betr|det|stan|nom|zonder|zonder-n , VNW|betr|pron|stan|vol|3|ev , VNW|betr|pron|stan|vol|persoon|getal , VNW|bez|det|gen|vol|3|ev|prenom|met-e|rest3 , VNW|bez|det|stan|nadr|2v|mv|prenom|zonder|agr , VNW|bez|det|stan|red|1|ev|prenom|zonder|agr , VNW|bez|det|stan|red|2v|ev|prenom|zonder|agr , VNW|bez|det|stan|red|3|ev|prenom|zonder|agr , VNW|bez|det|stan|vol|1|ev|prenom|met-e|rest , VNW|bez|det|stan|vol|1|ev|prenom|zonder|agr , VNW|bez|det|stan|vol|1|mv|prenom|met-e|rest , VNW|bez|det|stan|vol|1|mv|prenom|zonder|evon , VNW|bez|det|stan|vol|2v|ev|prenom|zonder|agr , VNW|bez|det|stan|vol|2|getal|prenom|zonder|agr , VNW|bez|det|stan|vol|3m|ev|nom|met-e|zonder-n , VNW|bez|det|stan|vol|3m|ev|prenom|met-e|rest , VNW|bez|det|stan|vol|3p|mv|prenom|met-e|rest , VNW|bez|det|stan|vol|3v|ev|nom|met-e|zonder-n , VNW|bez|det|stan|vol|3v|ev|prenom|met-e|rest , VNW|bez|det|stan|vol|3|ev|prenom|zonder|agr , VNW|bez|det|stan|vol|3|mv|prenom|zonder|agr , VNW|excl|pron|stan|vol|3|getal , VNW|onbep|adv-pron|gen|red|3|getal , VNW|onbep|adv-pron|obl|vol|3o|getal , VNW|onbep|det|stan|nom|met-e|mv-n , VNW|onbep|det|stan|nom|met-e|zonder-n , VNW|onbep|det|stan|nom|zonder|zonder-n , VNW|onbep|det|stan|prenom|met-e|agr , VNW|onbep|det|stan|prenom|met-e|evz , VNW|onbep|det|stan|prenom|met-e|mv , VNW|onbep|det|stan|prenom|met-e|rest , VNW|onbep|det|stan|prenom|zonder|agr , VNW|onbep|det|stan|prenom|zonder|evon , VNW|onbep|det|stan|vrij|zonder , VNW|onbep|grad|gen|nom|met-e|mv-n|basis , VNW|onbep|grad|stan|nom|met-e|mv-n|basis , VNW|onbep|grad|stan|nom|met-e|mv-n|sup , VNW|onbep|grad|stan|nom|met-e|zonder-n|basis , VNW|onbep|grad|stan|nom|met-e|zonder-n|sup , VNW|onbep|grad|stan|prenom|met-e|agr|basis , VNW|onbep|grad|stan|prenom|met-e|agr|comp , VNW|onbep|grad|stan|prenom|met-e|agr|sup , VNW|onbep|grad|stan|prenom|met-e|mv|basis , VNW|onbep|grad|stan|prenom|zonder|agr|basis , VNW|onbep|grad|stan|prenom|zonder|agr|comp , VNW|onbep|grad|stan|vrij|zonder|basis , VNW|onbep|grad|stan|vrij|zonder|comp , VNW|onbep|grad|stan|vrij|zonder|sup , VNW|onbep|pron|gen|vol|3p|ev , VNW|onbep|pron|stan|vol|3o|ev , VNW|onbep|pron|stan|vol|3p|ev , VNW|pers|pron|gen|vol|2|getal , VNW|pers|pron|nomin|nadr|3m|ev|masc , VNW|pers|pron|nomin|nadr|3v|ev|fem , VNW|pers|pron|nomin|red|1|mv , VNW|pers|pron|nomin|red|2v|ev , VNW|pers|pron|nomin|red|2|getal , VNW|pers|pron|nomin|red|3p|ev|masc , VNW|pers|pron|nomin|red|3|ev|masc , VNW|pers|pron|nomin|vol|1|ev , VNW|pers|pron|nomin|vol|1|mv , VNW|pers|pron|nomin|vol|2b|getal , VNW|pers|pron|nomin|vol|2v|ev , VNW|pers|pron|nomin|vol|2|getal , VNW|pers|pron|nomin|vol|3p|mv , VNW|pers|pron|nomin|vol|3v|ev|fem , VNW|pers|pron|nomin|vol|3|ev|masc , VNW|pers|pron|obl|nadr|3m|ev|masc , VNW|pers|pron|obl|red|3|ev|masc , VNW|pers|pron|obl|vol|2v|ev , VNW|pers|pron|obl|vol|3p|mv , VNW|pers|pron|obl|vol|3|ev|masc , VNW|pers|pron|obl|vol|3|getal|fem , VNW|pers|pron|stan|nadr|2v|mv , VNW|pers|pron|stan|red|3|ev|fem , VNW|pers|pron|stan|red|3|ev|onz , VNW|pers|pron|stan|red|3|mv , VNW|pr|pron|obl|nadr|1|ev , VNW|pr|pron|obl|nadr|2v|getal , VNW|pr|pron|obl|nadr|2|getal , VNW|pr|pron|obl|red|1|ev , VNW|pr|pron|obl|red|2v|getal , VNW|pr|pron|obl|vol|1|ev , VNW|pr|pron|obl|vol|1|mv , VNW|pr|pron|obl|vol|2|getal , VNW|recip|pron|gen|vol|persoon|mv , VNW|recip|pron|obl|vol|persoon|mv , VNW|refl|pron|obl|nadr|3|getal , VNW|refl|pron|obl|red|3|getal , VNW|vb|adv-pron|obl|vol|3o|getal , VNW|vb|det|stan|nom|met-e|zonder-n , VNW|vb|det|stan|prenom|met-e|rest , VNW|vb|det|stan|prenom|zonder|evon , VNW|vb|pron|gen|vol|3m|ev , VNW|vb|pron|gen|vol|3p|mv , VNW|vb|pron|gen|vol|3v|ev , VNW|vb|pron|stan|vol|3o|ev , VNW|vb|pron|stan|vol|3p|getal , VZ|fin , VZ|init , VZ|versm , WW|inf|nom|zonder|zonder-n , WW|inf|prenom|met-e , WW|inf|vrij|zonder , WW|od|nom|met-e|mv-n , WW|od|nom|met-e|zonder-n , WW|od|prenom|met-e , WW|od|prenom|zonder , WW|od|vrij|zonder , WW|pv|conj|ev , WW|pv|tgw|ev , WW|pv|tgw|met-t , WW|pv|tgw|mv , WW|pv|verl|ev , WW|pv|verl|mv , WW|vd|nom|met-e|mv-n , WW|vd|nom|met-e|zonder-n , WW|vd|prenom|met-e , WW|vd|prenom|zonder , WW|vd|vrij|zonder , _SP |
parser |
ROOT , acl , acl:relcl , advcl , advmod , amod , appos , aux , aux:pass , case , cc , ccomp , compound:prt , conj , cop , csubj , dep , det , expl , expl:pv , fixed , flat , iobj , mark , nmod , nmod:poss , nsubj , nsubj:pass , nummod , obj , obl , obl:agent , orphan , parataxis , punct , xcomp |
ner |
CARDINAL , DATE , EVENT , FAC , GPE , LANGUAGE , LAW , LOC , MONEY , NORP , ORDINAL , ORG , PERCENT , PERSON , PRODUCT , QUANTITY , TIME , WORK_OF_ART |
准确率
类型 | 得分 |
---|---|
TAG_ACC |
94.99 |
SENTS_P |
85.43 |
SENTS_R |
88.31 |
SENTS_F |
86.84 |
DEP_UAS |
86.82 |
DEP_LAS |
82.13 |
ENTS_P |
76.69 |
ENTS_R |
73.93 |
ENTS_F |
75.28 |
TOKEN_ACC |
99.94 |
TOKEN_P |
99.74 |
TOKEN_R |
99.76 |
TOKEN_F |
99.75 |
POS_ACC |
96.39 |
MORPH_ACC |
96.06 |
MORPH_MICRO_P |
96.97 |
MORPH_MICRO_R |
95.06 |
MORPH_MICRO_F |
96.01 |
LEMMA_ACC |
95.42 |
Indonesian Roberta Base Posp Tagger
MIT
这是一个基于印尼语RoBERTa模型微调的词性标注模型,在indonlu数据集上训练,用于印尼语文本的词性标注任务。
序列标注
Transformers

其他
I
w11wo
2.2M
7
Bert Base NER
MIT
基于BERT微调的命名实体识别模型,可识别四类实体:地点(LOC)、组织机构(ORG)、人名(PER)和杂项(MISC)
序列标注
英语
B
dslim
1.8M
592
Deid Roberta I2b2
MIT
该模型是基于RoBERTa微调的序列标注模型,用于识别和移除医疗记录中的受保护健康信息(PHI/PII)。
序列标注
Transformers

支持多种语言
D
obi
1.1M
33
Ner English Fast
Flair自带的英文快速4类命名实体识别模型,基于Flair嵌入和LSTM-CRF架构,在CoNLL-03数据集上达到92.92的F1分数。
序列标注
PyTorch
英语
N
flair
978.01k
24
French Camembert Postag Model
基于Camembert-base的法语词性标注模型,使用free-french-treebank数据集训练
序列标注
Transformers

法语
F
gilf
950.03k
9
Xlm Roberta Large Ner Spanish
基于XLM-Roberta-large架构微调的西班牙语命名实体识别模型,在CoNLL-2002数据集上表现优异。
序列标注
Transformers

西班牙语
X
MMG
767.35k
29
Nusabert Ner V1.3
MIT
基于NusaBert-v1.3在印尼语NER任务上微调的命名实体识别模型
序列标注
Transformers

其他
N
cahya
759.09k
3
Ner English Large
Flair框架内置的英文4类大型NER模型,基于文档级XLM-R嵌入和FLERT技术,在CoNLL-03数据集上F1分数达94.36。
序列标注
PyTorch
英语
N
flair
749.04k
44
Punctuate All
MIT
基于xlm-roberta-base微调的多语言标点符号预测模型,支持12种欧洲语言的标点符号自动补全
序列标注
Transformers

P
kredor
728.70k
20
Xlm Roberta Ner Japanese
MIT
基于xlm-roberta-base微调的日语命名实体识别模型
序列标注
Transformers

支持多种语言
X
tsmatz
630.71k
25
精选推荐AI模型
Llama 3 Typhoon V1.5x 8b Instruct
专为泰语设计的80亿参数指令模型,性能媲美GPT-3.5-turbo,优化了应用场景、检索增强生成、受限生成和推理任务
大型语言模型
Transformers

支持多种语言
L
scb10x
3,269
16
Cadet Tiny
Openrail
Cadet-Tiny是一个基于SODA数据集训练的超小型对话模型,专为边缘设备推理设计,体积仅为Cosmo-3B模型的2%左右。
对话系统
Transformers

英语
C
ToddGoldfarb
2,691
6
Roberta Base Chinese Extractive Qa
基于RoBERTa架构的中文抽取式问答模型,适用于从给定文本中提取答案的任务。
问答系统
中文
R
uer
2,694
98
AIbase是一个专注于MCP服务的平台,为AI开发者提供高质量的模型上下文协议服务,助力AI应用开发。
简体中文