language: ja
license: mit
tags:
- luke
- 情感分析
- wrime
- 情感分析
- pytorch
- 情感分类
datasets: shunk031/wrime
该模型是基于Luke-japanese-large-lite微调的模型
该模型能够分析文本中包含的八种情感(喜悦、悲伤、期待、惊讶、愤怒、恐惧、厌恶、信任)中的哪一种。
该模型使用了wrime数据集(https://huggingface.co/datasets/shunk031/wrime)进行训练。
本模型基于studio-ousia/Luke-japanese-large-lite
这是一个基于studio-ousia/Luke-japanese-large-lite进行微调的模型,能够分析文本中蕴含的情感类型(喜悦/悲伤/期待/惊讶/愤怒/恐惧/厌恶/信任)。模型使用wrime数据集完成微调。
什么是LUKE?[1]
LUKE(基于知识的嵌入语言理解)是一种基于Transformer的新型预训练上下文表示方法,可同时处理单词和实体。LUKE将文本中的单词和实体视为独立标记,并输出它们的上下文化表示。其采用实体感知的自注意力机制(Transformer自注意力机制的扩展版),在计算注意力分数时会考虑标记类型(单词或实体)。
LUKE在五项主流NLP基准测试中取得最先进成果,包括SQuAD v1.1(抽取式问答)、CoNLL-2003(命名实体识别)、ReCoRD(完形填空式问答)、TACRED(关系分类)和Open Entity(实体类型标注)。luke-japanese是LUKE的日语版本,这是一种融合实体知识的预训练Transformer模型,能够为单词和实体生成上下文感知的表示。
使用方法
步骤1:安装python、pytorch和sentencepiece,并更新transformers(旧版本可能不包含LukeTokenizer)
步骤2:执行以下代码
from transformers import AutoTokenizer, AutoModelForSequenceClassification, LukeConfig
import torch
tokenizer = AutoTokenizer.from_pretrained("Mizuiro-sakura/luke-japanese-large-sentiment-analysis-wrime")
config = LukeConfig.from_pretrained('Mizuiro-sakura/luke-japanese-large-sentiment-analysis-wrime', output_hidden_states=True)
model = AutoModelForSequenceClassification.from_pretrained('Mizuiro-sakura/luke-japanese-large-sentiment-analysis-wrime', config=config)
text='今天玩得非常开心。还想再去。'
max_seq_length=512
token=tokenizer(text,
truncation=True,
max_length=max_seq_length,
padding="max_length")
output=model(torch.tensor(token['input_ids']).unsqueeze(0), torch.tensor(token['attention_mask']).unsqueeze(0))
max_index=torch.argmax(torch.tensor(output.logits))
if max_index==0:
print('joy,喜悦')
elif max_index==1:
print('sadness,悲伤')
elif max_index==2:
print('anticipation,期待')
elif max_index==3:
print('surprise,惊讶')
elif max_index==4:
print('anger,愤怒')
elif max_index==5:
print('fear,恐惧')
elif max_index==6:
print('disgust,厌恶')
elif max_index==7:
print('trust,信任')
致谢
衷心感谢LUKE开发者山田先生(@ikuyamada)和Studio ousia团队(@StudioOusia)。
引用文献
[1]@inproceedings{yamada2020luke,
title={LUKE: 基于实体感知自注意力的深度上下文化实体表示},
author={山田郁也 and 浅井彰利 and 進藤裕之 and 武田英明 and 松本裕治},
booktitle={EMNLP},
year={2020}
}