模型介绍
内容详情
替代品
模型简介
spaCy提供的大型丹麦语处理模型,支持词性标注、依存句法分析、命名实体识别、词形还原等自然语言处理任务,针对CPU使用进行了优化
模型特点
CPU优化
专门针对CPU使用场景进行优化的处理流程
完整NLP功能
提供从分词到命名实体识别的完整自然语言处理能力
高质量词向量
包含500000个唯一词向量(300维),基于fastText训练
模型能力
分词
词性标注
依存句法分析
命名实体识别
词形还原
形态分析
句子边界检测
使用案例
文本分析
丹麦语文本处理
处理丹麦语文本,提取语法结构和语义信息
准确率:词性标注96.66%,命名实体识别F1值80.95%
信息提取
实体识别
从丹麦语文本中识别人名、地名、组织机构名等实体
精确率80.04%,召回率81.88%
标签:
- spacy
- 标记分类 语言:
- da(丹麦语) 许可证:cc-by-sa-4.0 模型索引:
- 名称:da_core_news_lg
结果:
- 任务:
名称:NER
类型:标记分类
指标:
- 名称:NER精确率 类型:精确率 值:0.800407332
- 名称:NER召回率 类型:召回率 值:0.81875
- 名称:NER F值 类型:f_score 值:0.8094747683
- 任务:
名称:TAG
类型:标记分类
指标:
- 名称:TAG (XPOS) 准确率 类型:准确率 值:0.9665859564
- 任务:
名称:POS
类型:标记分类
指标:
- 名称:POS (UPOS) 准确率 类型:准确率 值:0.9665859564
- 任务:
名称:MORPH
类型:标记分类
指标:
- 名称:形态 (UFeats) 准确率 类型:准确率 值:0.9573849879
- 任务:
名称:LEMMA
类型:标记分类
指标:
- 名称:词形还原准确率 类型:准确率 值:0.948377724
- 任务:
名称:UNLABELED_DEPENDENCIES
类型:标记分类
指标:
- 名称:无标记依存关系评分 (UAS) 类型:f_score 值:0.8225238813
- 任务:
名称:LABELED_DEPENDENCIES
类型:标记分类
指标:
- 名称:有标记依存关系评分 (LAS) 类型:f_score 值:0.7828612927
- 任务:
名称:SENTS
类型:标记分类
指标:
- 名称:句子F值 类型:f_score 值:0.8869100623
- 任务:
名称:NER
类型:标记分类
指标:
详情:https://spacy.io/models/da#da_core_news_lg
针对CPU优化的丹麦语处理流程。组件包括:tok2vec、morphologizer、parser、lemmatizer(可训练的词形还原器)、senter、ner、attribute_ruler。
特性 | 描述 |
---|---|
名称 | da_core_news_lg |
版本 | 3.7.0 |
spaCy | >=3.7.0,<3.8.0 |
默认流程 | tok2vec 、morphologizer 、parser 、lemmatizer 、attribute_ruler 、ner |
组件 | tok2vec 、morphologizer 、parser 、lemmatizer 、senter 、attribute_ruler 、ner |
向量 | 500000个键,500000个唯一向量(300维) |
来源 | UD Danish DDT v2.8(Johannsen, Anders; Martínez Alonso, Héctor; Plank, Barbara) DaNE(Rasmus Hvingelby, Amalie B. Pauli, Maria Barrett, Christina Rosted, Lasse M. Lidegaard, Anders Søgaard) Explosion fastText 向量(cbow, OSCAR Common Crawl + Wikipedia)(Explosion) |
许可证 | CC BY-SA 4.0 |
作者 | Explosion |
标签方案
查看标签方案(3个组件的194个标签)
组件 | 标签 |
---|---|
morphologizer |
AdpType=Prep|POS=ADP , Definite=Ind|Gender=Com|Number=Sing|POS=NOUN , Mood=Ind|POS=AUX|Tense=Pres|VerbForm=Fin|Voice=Act , POS=PROPN , Definite=Ind|Number=Sing|POS=VERB|Tense=Past|VerbForm=Part , Definite=Def|Gender=Neut|Number=Sing|POS=NOUN , POS=SCONJ , Definite=Def|Gender=Com|Number=Sing|POS=NOUN , Mood=Ind|POS=VERB|Tense=Pres|VerbForm=Fin|Voice=Act , POS=ADV , Number=Plur|POS=DET|PronType=Dem , Degree=Pos|Number=Plur|POS=ADJ , Definite=Ind|Gender=Com|Number=Plur|POS=NOUN , POS=PUNCT , POS=CCONJ , Definite=Ind|Degree=Cmp|Number=Sing|POS=ADJ , Degree=Cmp|POS=ADJ , POS=PRON|PartType=Inf , Gender=Com|Number=Sing|POS=DET|PronType=Ind , Definite=Ind|Degree=Pos|Number=Sing|POS=ADJ , Case=Acc|Gender=Neut|Number=Sing|POS=PRON|Person=3|PronType=Prs , Definite=Ind|Gender=Neut|Number=Plur|POS=NOUN , Definite=Def|Degree=Pos|Number=Sing|POS=ADJ , Gender=Neut|Number=Sing|POS=DET|PronType=Dem , Degree=Pos|POS=ADV , Definite=Def|Number=Sing|POS=VERB|Tense=Past|VerbForm=Part , Definite=Ind|Gender=Neut|Number=Sing|POS=NOUN , POS=PRON|PronType=Dem , NumType=Card|POS=NUM , Definite=Ind|Degree=Pos|Gender=Neut|Number=Sing|POS=ADJ , Case=Acc|Gender=Com|Number=Sing|POS=PRON|Person=3|PronType=Prs , Degree=Pos|Gender=Com|Number=Sing|POS=ADJ , Case=Nom|Gender=Com|Number=Sing|POS=PRON|Person=3|PronType=Prs , NumType=Ord|POS=ADJ , Gender=Com|Number=Sing|Number[psor]=Sing|POS=DET|Person=3|Poss=Yes|PronType=Prs|Reflex=Yes , Mood=Ind|POS=AUX|Tense=Past|VerbForm=Fin|Voice=Act , POS=VERB|VerbForm=Inf|Voice=Act , Mood=Ind|POS=VERB|Tense=Past|VerbForm=Fin|Voice=Act , POS=NOUN , Mood=Ind|POS=VERB|Tense=Pres|VerbForm=Fin|Voice=Pass , POS=ADP|PartType=Inf , Degree=Pos|POS=ADJ , Definite=Def|Gender=Com|Number=Plur|POS=NOUN , Number[psor]=Sing|POS=DET|Person=3|Poss=Yes|PronType=Prs , Case=Gen|Definite=Def|Gender=Com|Number=Sing|POS=NOUN , POS=AUX|VerbForm=Inf|Voice=Act , Definite=Ind|Degree=Pos|Gender=Com|Number=Sing|POS=ADJ , Gender=Com|Number=Sing|POS=DET|PronType=Dem , Number=Plur|POS=DET|PronType=Ind , Gender=Com|Number=Sing|POS=PRON|PronType=Ind , Case=Acc|POS=PRON|Person=3|PronType=Prs|Reflex=Yes , POS=PART|PartType=Inf , Gender=Neut|Number=Sing|POS=DET|PronType=Ind , Case=Acc|Number=Plur|POS=PRON|Person=3|PronType=Prs , Case=Gen|Definite=Def|Gender=Neut|Number=Sing|POS=NOUN , Case=Nom|Number=Plur|POS=PRON|Person=3|PronType=Prs , Case=Nom|Gender=Com|Number=Sing|POS=PRON|Person=1|PronType=Prs , Case=Nom|Gender=Com|POS=PRON|PronType=Ind , Gender=Neut|Number=Sing|POS=PRON|PronType=Ind , Mood=Imp|POS=VERB , Gender=Com|Number=Sing|Number[psor]=Sing|POS=DET|Person=1|Poss=Yes|PronType=Prs , Definite=Ind|Number=Sing|POS=AUX|Tense=Past|VerbForm=Part , POS=X , Case=Nom|Gender=Com|Number=Plur|POS=PRON|Person=1|PronType=Prs , Case=Gen|Definite=Def|Gender=Com|Number=Plur|POS=NOUN , POS=VERB|Tense=Pres|VerbForm=Part , Number=Plur|POS=PRON|PronType=Int,Rel , POS=VERB|VerbForm=Inf|Voice=Pass , Case=Gen|Definite=Ind|Gender=Com|Number=Sing|POS=NOUN , Degree=Cmp|POS=ADV , POS=ADV|PartType=Inf , Degree=Sup|POS=ADV , Number=Plur|POS=PRON|PronType=Dem , Number=Plur|POS=PRON|PronType=Ind , Definite=Def|Gender=Neut|Number=Plur|POS=NOUN , Case=Acc|Gender=Com|Number=Sing|POS=PRON|Person=1|PronType=Prs , Case=Gen|POS=PROPN , POS=ADP , Degree=Cmp|Number=Plur|POS=ADJ , Definite=Def|Degree=Sup|POS=ADJ , Gender=Neut|Number=Sing|Number[psor]=Sing|POS=DET|Person=1|Poss=Yes|PronType=Prs , Degree=Pos|Number=Sing|POS=ADJ , Number=Plur|Number[psor]=Sing|POS=DET|Person=3|Poss=Yes|PronType=Prs|Reflex=Yes , Gender=Com|Number=Sing|Number[psor]=Plur|POS=DET|Person=1|Poss=Yes|PronType=Prs|Style=Form , Number=Plur|POS=PRON|PronType=Rcp , Case=Gen|Degree=Cmp|POS=ADJ , POS=SPACE , Case=Gen|Definite=Def|Gender=Neut|Number=Plur|POS=NOUN , Number[psor]=Plur|POS=DET|Person=3|Poss=Yes|PronType=Prs , POS=INTJ , Number=Plur|Number[psor]=Sing|POS=DET|Person=1|Poss=Yes|PronType=Prs , Degree=Pos|Gender=Neut|Number=Sing|POS=ADJ , Gender=Neut|Number=Sing|Number[psor]=Plur|POS=DET|Person=1|Poss=Yes|PronType=Prs|Style=Form , Case=Acc|Gender=Com|Number=Sing|POS=PRON|Person=2|PronType=Prs , Gender=Com|Number=Sing|Number[psor]=Sing|POS=DET|Person=2|Poss=Yes|PronType=Prs , Case=Gen|Definite=Ind|Gender=Neut|Number=Plur|POS=NOUN , Number=Sing|POS=PRON|PronType=Int,Rel , Number=Plur|Number[psor]=Plur|POS=DET|Person=1|Poss=Yes|PronType=Prs|Style=Form , Gender=Neut|Number=Sing|POS=PRON|PronType=Int,Rel , Definite=Def|Degree=Sup|Number=Plur|POS=ADJ , Case=Nom|Gender=Com|Number=Sing|POS=PRON|Person=2|PronType=Prs , Gender=Neut|Number=Sing|Number[psor]=Sing|POS=DET|Person=3|Poss=Yes|PronType=Prs|Reflex=Yes , Definite=Ind|Number=Sing|POS=NOUN , Number=Plur|POS=VERB|Tense=Past|VerbForm=Part , Number=Plur|Number[psor]=Sing|POS=PRON|Person=3|Poss=Yes|PronType=Prs|Reflex=Yes , POS=SYM , Case=Nom|Gender=Com|POS=PRON|Person=2|Polite=Form|PronType=Prs , Degree=Sup|POS=ADJ , Number=Plur|POS=DET|PronType=Ind|Style=Arch , Case=Gen|Gender=Com|Number=Sing|POS=DET|PronType=Dem , Foreign=Yes|POS=X , POS=DET|Person=2|Polite=Form|Poss=Yes|PronType=Prs , Gender=Neut|Number=Sing|POS=PRON|PronType=Dem , Case=Acc|Gender=Com|Number=Plur|POS=PRON|Person=1|PronType=Prs , Case=Gen|Definite=Ind|Gender=Neut|Number=Sing|POS=NOUN , Case=Gen|POS=PRON|PronType=Int,Rel , Gender=Com|Number=Sing|POS=PRON|PronType=Dem , Abbr=Yes|POS=X , Case=Gen|Definite=Ind|Gender=Com|Number=Plur|POS=NOUN , Definite=Def|Degree=Abs|POS=ADJ , Definite=Ind|Degree=Sup|Number=Sing|POS=ADJ , Definite=Ind|POS=NOUN , Gender=Com|Number=Plur|POS=NOUN , Number[psor]=Plur|POS=DET|Person=1|Poss=Yes|PronType=Prs , Gender=Com|POS=PRON|PronType=Int,Rel , Case=Nom|Gender=Com|Number=Plur|POS=PRON|Person=2|PronType=Prs , Degree=Abs|POS=ADV , POS=VERB|VerbForm=Ger , POS=VERB|Tense=Past|VerbForm=Part , Definite=Def|Degree=Sup|Number=Sing|POS=ADJ , Number=Plur|Number[psor]=Plur|POS=PRON|Person=1|Poss=Yes|PronType=Prs|Style=Form , Case=Gen|Definite=Def|Degree=Pos|Number=Sing|POS=ADJ , Case=Gen|Degree=Pos|Number=Plur|POS=ADJ , Case=Acc|Gender=Com|POS=PRON|Person=2|Polite=Form|PronType=Prs , Gender=Com|Number=Sing|POS=PRON|PronType=Int,Rel , POS=VERB|Tense=Pres , Case=Gen|Number=Plur|POS=DET|PronType=Ind , Number[psor]=Plur|POS=DET|Person=2|Poss=Yes|PronType=Prs , POS=PRON|Person=2|Polite=Form|Poss=Yes|PronType=Prs , Gender=Neut|Number=Sing|Number[psor]=Sing|POS=DET|Person=2|Poss=Yes|PronType=Prs , POS=AUX|Tense=Pres|VerbForm=Part , Mood=Ind|POS=VERB|Tense=Past|VerbForm=Fin|Voice=Pass , Gender=Com|Number=Sing|Number[psor]=Sing|POS=PRON|Person=3|Poss=Yes|PronType=Prs|Reflex=Yes , Degree=Sup|Number=Plur|POS=ADJ , Case=Acc|Gender=Com|Number=Plur|POS=PRON|Person=2|PronType=Prs , Gender=Neut|Number=Sing|Number[psor]=Sing|POS=PRON|Person=3|Poss=Yes|PronType=Prs|Reflex=Yes , Definite=Ind|Number=Plur|POS=NOUN , Case=Gen|Number=Plur|POS=VERB|Tense=Past|VerbForm=Part , Mood=Imp|POS=AUX , Gender=Com|Number=Sing|Number[psor]=Sing|POS=PRON|Person=1|Poss=Yes|PronType=Prs , Number[psor]=Sing|POS=PRON|Person=3|Poss=Yes|PronType=Prs , Definite=Def|Gender=Com|Number=Sing|POS=VERB|Tense=Past|VerbForm=Part , Number=Plur|Number[psor]=Sing|POS=DET|Person=2|Poss=Yes|PronType=Prs , Case=Gen|Gender=Com|Number=Sing|POS=DET|PronType=Ind , Case=Gen|POS=NOUN , Number[psor]=Plur|POS=PRON|Person=3|Poss=Yes|PronType=Prs , POS=DET|PronType=Dem , Definite=Def|Number=Plur|POS=NOUN |
parser |
ROOT , acl:relcl , advcl , advmod , advmod:lmod , amod , appos , aux , case , cc , ccomp , compound:prt , conj , cop , dep , det , expl , fixed , flat , iobj , list , mark , nmod , nmod:poss , nsubj , nummod , obj , obl , obl:lmod , obl:tmod , punct , xcomp |
ner |
LOC , MISC , ORG , PER |
准确率
类型 | 得分 |
---|---|
TOKEN_ACC |
99.89 |
TOKEN_P |
99.78 |
TOKEN_R |
99.75 |
TOKEN_F |
99.76 |
POS_ACC |
96.66 |
MORPH_ACC |
95.74 |
MORPH_MICRO_P |
97.43 |
MORPH_MICRO_R |
96.75 |
MORPH_MICRO_F |
97.09 |
SENTS_P |
89.09 |
SENTS_R |
88.30 |
SENTS_F |
88.69 |
DEP_UAS |
82.25 |
DEP_LAS |
78.29 |
LEMMA_ACC |
94.84 |
TAG_ACC |
96.66 |
ENTS_P |
80.04 |
ENTS_R |
81.88 |
ENTS_F |
80.95 |
Indonesian Roberta Base Posp Tagger
MIT
这是一个基于印尼语RoBERTa模型微调的词性标注模型,在indonlu数据集上训练,用于印尼语文本的词性标注任务。
序列标注
Transformers

其他
I
w11wo
2.2M
7
Bert Base NER
MIT
基于BERT微调的命名实体识别模型,可识别四类实体:地点(LOC)、组织机构(ORG)、人名(PER)和杂项(MISC)
序列标注
英语
B
dslim
1.8M
592
Deid Roberta I2b2
MIT
该模型是基于RoBERTa微调的序列标注模型,用于识别和移除医疗记录中的受保护健康信息(PHI/PII)。
序列标注
Transformers

支持多种语言
D
obi
1.1M
33
Ner English Fast
Flair自带的英文快速4类命名实体识别模型,基于Flair嵌入和LSTM-CRF架构,在CoNLL-03数据集上达到92.92的F1分数。
序列标注
PyTorch
英语
N
flair
978.01k
24
French Camembert Postag Model
基于Camembert-base的法语词性标注模型,使用free-french-treebank数据集训练
序列标注
Transformers

法语
F
gilf
950.03k
9
Xlm Roberta Large Ner Spanish
基于XLM-Roberta-large架构微调的西班牙语命名实体识别模型,在CoNLL-2002数据集上表现优异。
序列标注
Transformers

西班牙语
X
MMG
767.35k
29
Nusabert Ner V1.3
MIT
基于NusaBert-v1.3在印尼语NER任务上微调的命名实体识别模型
序列标注
Transformers

其他
N
cahya
759.09k
3
Ner English Large
Flair框架内置的英文4类大型NER模型,基于文档级XLM-R嵌入和FLERT技术,在CoNLL-03数据集上F1分数达94.36。
序列标注
PyTorch
英语
N
flair
749.04k
44
Punctuate All
MIT
基于xlm-roberta-base微调的多语言标点符号预测模型,支持12种欧洲语言的标点符号自动补全
序列标注
Transformers

P
kredor
728.70k
20
Xlm Roberta Ner Japanese
MIT
基于xlm-roberta-base微调的日语命名实体识别模型
序列标注
Transformers

支持多种语言
X
tsmatz
630.71k
25
精选推荐AI模型
Llama 3 Typhoon V1.5x 8b Instruct
专为泰语设计的80亿参数指令模型,性能媲美GPT-3.5-turbo,优化了应用场景、检索增强生成、受限生成和推理任务
大型语言模型
Transformers

支持多种语言
L
scb10x
3,269
16
Cadet Tiny
Openrail
Cadet-Tiny是一个基于SODA数据集训练的超小型对话模型,专为边缘设备推理设计,体积仅为Cosmo-3B模型的2%左右。
对话系统
Transformers

英语
C
ToddGoldfarb
2,691
6
Roberta Base Chinese Extractive Qa
基于RoBERTa架构的中文抽取式问答模型,适用于从给定文本中提取答案的任务。
问答系统
中文
R
uer
2,694
98
AIbase是一个专注于MCP服务的平台,为AI开发者提供高质量的模型上下文协议服务,助力AI应用开发。
简体中文