T5-large-sentiment-analysis-Chinese-MultiTask开源模型 - 支持多格式中文情感分析任务

首页

T5 Large Sentiment Analysis Chinese MultiTask

由 yuyijiong 开发

改进版T5模型，专为中文情感分析任务设计，支持多种情感分析子任务和输出格式。

文本分类

Transformers

支持多种语言#细粒度情感分析 #多任务统一建模 #中英双语支持

下载量 71

发布时间 : 5/12/2023

模型简介

该模型是基于T5架构改进的情感分析模型，支持多种情感分析任务，包括四元组、三元组和二元组抽取，以及情感极性判断。模型在多个中英文情感分析数据集上微调，并增加了ChatGPT生成的数据以提高性能。

模型特点

多任务支持

支持多种情感分析任务，包括四元组、三元组和二元组抽取，以及情感极性判断。

灵活的输出控制

可通过附加条件控制答案生成，如观点抽取方式、特定方面分析等。

多语言支持

支持中文和英文的情感分析任务。

数据增强

使用ChatGPT生成部分数据以提高模型性能。

模型能力

情感四元组抽取

情感三元组抽取

情感二元组抽取

情感极性判断

多语言情感分析

使用案例

电商评论分析

商品评论情感分析

分析用户对商品的情感倾向，提取具体的评价对象、观点和情感极性。

可准确识别商品评价中的正面、负面和中性情感，并提取相关要素。

社交媒体监控

社交媒体情感分析

监控社交媒体上用户对特定话题或品牌的情感倾向。

可实时分析大量社交媒体文本，提取情感要素和极性。

🚀 情感分析任务 T5模型

本模型是 yuyijiong/T5-large-sentiment-analysis-Chinese 的改进版，增加了更多任务，并使用 ChatGPT 生成部分数据。它在多个中英文情感分析数据集上进行了微调，能够输出特定格式的情感分析结果，可使用指定的评估指标进行评估，还支持多种情感分析任务，同时可以通过额外条件控制答案生成。

📦 安装指南

文档未提及安装步骤，此处跳过。

💻 使用示例

基础用法

可以使用 yuyijiong/quad_match_score 评估指标进行评估：

import evaluate
module = evaluate.load("yuyijiong/quad_match_score")
predictions=["food | good | food#taste | pos"]
references=["food | good | food#taste | pos & service | bad | service#general | neg"]
result=module.compute(predictions=predictions, references=references)
print(result)

高级用法

以下是使用该模型进行情感分析的代码示例：

import torch
from transformers import T5Tokenizer, AutoModelForSeq2SeqLM

tokenizer = T5Tokenizer.from_pretrained("yuyijiong/T5-large-sentiment-analysis-Chinese-MultiTask")
model = AutoModelForSeq2SeqLM.from_pretrained("yuyijiong/T5-large-sentiment-analysis-Chinese-MultiTask", device_map="auto")
generation_config=GenerationConfig.from_pretrained("yuyijiong/T5-large-sentiment-analysis-Chinese-MultiTask")
text = '情感四元组(对象 | 观点 | 方面 | 极性)抽取任务(观点可以较长): [个头大、口感不错,就是个别坏了的或者有烂掉口子刻意用泥土封着,这样做不好。]'
input_ids = tokenizer(text,return_tensors="pt", padding=True)['input_ids'].cuda(0)
with torch.no_grad():
  output = model.generate(input_ids=input_ids,generation_config=generation_config)
output_str = tokenizer.batch_decode(output, skip_special_tokens=True)
print(output_str)

📚 详细文档

输出格式

输出格式为

'对象1 | 观点1 | 方面1 | 情感极性1 & 对象2 | 观点2 | 方面2 | 情感极性2 ......'

支持的情感分析任务

支持以下情感分析任务：

["四元组(对象 | 观点 | 方面 | 极性)",
'二元组(对象 | 观点)',
'三元组(对象 | 观点 | 方面)',
'三元组(对象 | 观点 | 极性)',
'三元组(对象 | 方面 | 极性)',
'二元组(方面 | 极性)',
'二元组(观点 | 极性)',
'单元素(极性)']

额外条件控制

可以增加额外条件来控制答案的生成，例如：

答案风格控制，希望抽取的观点为整句话或缩减为几个词：
- (观点尽量短)
- (观点可以较长)
- (对较长观点进行概括) 注意此条件可能使答案中出现与原文不同的词
可以对指定的方面做情感分析：
- (方面选项:商品/物流/商家/平台)
情感对象 target 可能为 null，表示文本中未明确给出，可以允许模型自动猜测为 null 的对象：
- (补全 null)

用法示例

Q:情感四元组(对象 | 观点 | 方面 | 极性)抽取任务(观点可以较长): [个头大、口感不错,就是个别坏了的或者有烂掉口子刻意用泥土封着,这样做不好。]
A:个头 | 大 | 商品#大小 | 积极 & 口感 | 不错 | 商品#口感 | 积极 & null | 个别坏了的或者有烂掉口子刻意用泥土封着,这样做不好 | 商品#新鲜程度 | 消极

Q:情感四元组(对象 | 观点 | 方面 | 极性)抽取任务(观点可以较长，补全null): [个头大、口感不错,就是个别坏了的或者有烂掉口子刻意用泥土封着,这样做不好。]
A:个头 | 大 | 商品#大小 | 积极 & 口感 | 不错 | 商品#口感 | 积极 & null (个别) | 有烂掉口子刻意用泥土封着,这样做不好 | 商品#新鲜程度 | 消极

Q:情感四元组(对象 | 观点 | 方面 | 极性)抽取任务(观点尽量短): [个头大、口感不错,就是个别坏了的或者有烂掉口子刻意用泥土封着,这样做不好。]
A:个头 | 大 | 商品#大小 | 积极 & 口感 | 不错 | 商品#口感 | 积极

Q:情感四元组(对象 | 观点 | 方面 | 极性)抽取任务(对较长观点进行概括): [个头大、口感不错,就是个别坏了的或者有烂掉口子刻意用泥土封着,这样做不好。]
A:个头 | 大 | 商品#大小 | 积极 & 口感 | 不错 | 商品#口感 | 积极 & null | 坏了口子封泥 | 商品#新鲜程度 | 消极

Q:情感三元组(对象 | 观点 | 极性)抽取任务(观点可以较长，补全null): [个头大、口感不错,就是个别坏了的或者有烂掉口子刻意用泥土封着,这样做不好。]
A:个头 | 大 | 积极 & 口感 | 不错 | 积极 & null (花生) | 个别坏了的或者有烂掉口子刻意用泥土封着,这样做不好 | 消极

Q:判断以下评论的情感极性: [个头大、口感不错,就是个别坏了的或者有烂掉口子刻意用泥土封着,这样做不好。]
A:中性

Q:情感二元组(方面 | 极性)抽取任务(方面选项: 价格#性价比/价格#折扣/价格#水平/食品#外观/食物#分量/食物#味道/食物#推荐): [个头大、口感不错,就是个别坏了的或者有烂掉口子刻意用泥土封着,这样做不好。]
A:食物#分量 | 积极 & 食物#味道 | 中性

Q:sentiment quadruples (target | opinion | aspect | polarity) extraction task : [The hot dogs are good , yes , but the reason to get over here is the fantastic pork croquette sandwich , perfect on its supermarket squishy bun .]
A:hot dogs | good | food#quality | pos & pork croquette sandwich | fantastic | food#quality | pos & bun | perfect | food#quality | pos