语言:
- 英文
标签:
- 基于方面的情感分析
- PyABSA
许可证: MIT
数据集:
- 笔记本14
- 餐厅14
- 餐厅16
- ACL-Twitter
- MAMS
- 电视
- T恤
- Yelp
评估指标:
- 准确率
- 宏平均F1
示例输入:
- 文本: "[CLS] 当餐桌空出来时,经理却先安排了另一桌客人。[SEP] 经理 [SEP] "
由PyABSA驱动:一个基于方面的情感分析开源工具
该模型使用超过3万条ABSA样本进行训练,详见ABSADatasets。测试集未包含在预训练中,因此您可以使用此模型在常见的ABSA数据集(如Laptop14、Rest14数据集)上进行训练和基准测试。(Rest15数据集除外!)
使用方法
from transformers import AutoTokenizer, AutoModelForSequenceClassification
# 加载ABSA模型和分词器
model_name = "yangheng/deberta-v3-base-absa-v1.1"
tokenizer = AutoTokenizer.from_pretrained(model_name)
model = AutoModelForSequenceClassification.from_pretrained(model_name)
classifier = pipeline("text-classification", model=model, tokenizer=tokenizer)
for aspect in ['相机', '手机']:
print(aspect, classifier('这部手机的相机质量非常出色。', text_pair=aspect))
用于基于方面的情感分析的DeBERTa模型
deberta-v3-base-absa
模型专为基于方面的情感分析设计,使用来自ABSADatasets的英文数据集训练。
训练模型
此模型基于FAST-LCF-BERT模型,采用microsoft/deberta-v3-base
进行训练,源自PyABSA。
要追踪最先进的模型,请参阅PyASBA。
PyASBA中的示例
在PyASBA数据集中使用FAST-LCF-BERT的示例。
数据集
该模型通过18万条ABSA数据集样本(包括增强数据)进行微调。训练数据集文件包括:
加载:integrated_datasets/apc_datasets/SemEval/laptop14/Laptops_Train.xml.seg
加载:integrated_datasets/apc_datasets/SemEval/restaurant14/Restaurants_Train.xml.seg
加载:integrated_datasets/apc_datasets/SemEval/restaurant16/restaurant_train.raw
加载:integrated_datasets/apc_datasets/ACL_Twitter/acl-14-short-data/train.raw
加载:integrated_datasets/apc_datasets/MAMS/train.xml.dat
加载:integrated_datasets/apc_datasets/Television/Television_Train.xml.seg
加载:integrated_datasets/apc_datasets/TShirt/Menstshirt_Train.xml.seg
加载:integrated_datasets/apc_datasets/Yelp/yelp.train.txt
如果您在研究中使用了此模型,请引用我们的论文:
@inproceedings{DBLP:conf/cikm/0008ZL23,
作者 = {杨恒 and
张晨 and
李科},
编辑 = {Ingo Frommholz and
Frank Hopfgartner and
Mark Lee and
Michael Oakes and
Mounia Lalmas and
Min Zhang and
Rodrygo L. T. Santos},
标题 = {PyABSA:一个模块化的可重复基于方面情感分析框架},
会议名称 = {第32届ACM国际信息与知识管理会议论文集,{CIKM} 2023,英国伯明翰,2023年10月21-25日},
页码 = {5117--5122},
出版社 = {{ACM}},
年份 = {2023},
网址 = {https://doi.org/10.1145/3583780.3614752},
DOI = {10.1145/3583780.3614752},
时间戳 = {2023年11月23日 13:25:05 +0100},
文献链接 = {https://dblp.org/rec/conf/cikm/0008ZL23.bib},
文献来源 = {dblp计算机科学文献库, https://dblp.org}
}
@article{YangZMT21,
作者 = {杨恒 and
曾碧青 and
徐麦宜 and
王天行},
标题 = {回归现实:利用模式驱动建模实现经济高效的情感依赖学习},
期刊 = {CoRR},
卷号 = {abs/2110.08604},
年份 = {2021},
网址 = {https://arxiv.org/abs/2110.08604},
电子版类型 = {arXiv},
电子版 = {2110.08604},
时间戳 = {2021年10月22日 13:33:09 +0200},
文献链接 = {https://dblp.org/rec/journals/corr/abs-2110-08604.bib},
文献来源 = {dblp计算机科学文献库, https://dblp.org}
}