🚀 EstBERT_NER
EstBERT_NER是一个经过微调的EstBERT模型,可用于命名实体识别。该模型能够解决在爱沙尼亚语语境下识别特定实体的问题,为相关自然语言处理任务提供了有效的工具,具有重要的应用价值。
🚀 快速开始
你可以使用Transformers库的pipeline进行命名实体识别(NER)。由于模型偶尔会将子词标记为实体,因此可能需要对结果进行后处理。
from transformers import BertTokenizer, BertForTokenClassification
from transformers import pipeline
tokenizer = BertTokenizer.from_pretrained('tartuNLP/EstBERT_NER')
bertner = BertForTokenClassification.from_pretrained('tartuNLP/EstBERT_NER')
nlp = pipeline("ner", model=bertner, tokenizer=tokenizer)
sentence = 'Eesti Ekspressi teada on Eesti Pank uurinud Hansapanga tehinguid , mis toimusid kaks aastat tagasi suvel ja mille käigus voolas panka ligi miljardi krooni ulatuses kahtlast raha .'
ner_results = nlp(sentence)
print(ner_results)
输出示例
[{'word': 'Eesti', 'score': 0.9964128136634827, 'entity': 'B-ORG', 'index': 1}, {'word': 'Ekspressi', 'score': 0.9978809356689453, 'entity': 'I-ORG', 'index': 2}, {'word': 'Eesti', 'score': 0.9988121390342712, 'entity': 'B-ORG', 'index': 5}, {'word': 'Pank', 'score': 0.9985784292221069, 'entity': 'I-ORG', 'index': 6}, {'word': 'Hansapanga', 'score': 0.9979034662246704, 'entity': 'B-ORG', 'index': 8}]
✨ 主要特性
EstBERT_NER是一个经过微调的EstBERT模型,可用于命名实体识别。该模型在由Tkachenko等人创建的爱沙尼亚语NER数据集上进行训练,能够识别三种类型的实体:地点(LOC)、组织(ORG)和人物(PER)。
📚 详细文档
BibTeX引用和引用信息
@misc{tanvir2020estbert,
title={EstBERT: A Pretrained Language-Specific BERT for Estonian},
author={Hasan Tanvir and Claudia Kittask and Kairit Sirts},
year={2020},
eprint={2011.04784},
archivePrefix={arXiv},
primaryClass={cs.CL}
}
📄 许可证
本项目采用CC BY 4.0许可证。
属性 |
详情 |
基础模型 |
tartuNLP/EstBERT |
许可证 |
CC BY 4.0 |