hebEMO_sadness开源情感检测工具 - 免费检测希伯来语UGC情感极性

首页

Hebemo Sadness

由 avichr 开发

HebEMO是一款用于检测极性并从现代希伯来语用户生成内容(UGC)中提取情感的工具

文本分类

Transformers

#希伯来语情感分析 #高精度极性检测 #新闻评论处理

下载量 108

发布时间 : 3/2/2022

模型简介

HebEMO是一个基于BERT的希伯来语情感分析模型，能够识别文本中的情感极性和八种基本情绪（愤怒、厌恶、期待、恐惧、快乐、悲伤、惊讶和信任）。该模型在希伯来语情感分析任务中表现出色，特别是在极性分类方面达到了0.96的加权平均F1分数。

模型特点

高精度情感极性分析

在极性分类任务中达到加权平均F1分数0.96的优异表现

多情绪识别

能够识别八种基本情绪，除惊讶外其他情绪的F1分数均在0.78-0.97之间

针对希伯来语优化

专门针对现代希伯来语用户生成内容进行训练和优化

大规模训练数据

基于包含700余万词和35万句的希伯来语新闻评论数据集训练

模型能力

文本情感极性分析（积极/消极/中立）

多情绪识别（八种基本情绪）

希伯来语自然语言处理

用户生成内容分析

使用案例

社交媒体分析

新闻评论情感分析

分析希伯来语新闻网站评论中的用户情感倾向

可准确识别评论中的情感极性和具体情绪

市场研究

产品评价分析

分析希伯来语用户对产品或服务的评价情感

帮助了解消费者对产品的情绪反应

🚀 HebEMO - 现代希伯来语情感识别模型

HebEMO 是一款用于检测现代希伯来语用户生成内容（UGC）情感极性并提取情感的工具。该模型基于我们收集并标注的独特新冠疫情相关数据集进行训练。

HebEMO 在极性分类任务中取得了加权平均 F1 分数为 0.96 的优异成绩。在情感检测方面，除“惊讶”情感（F1 分数为 0.41，模型未能很好地捕捉该情感）外，其他情感的 F1 分数达到了 0.78 - 0.97。即使与英语模型相比，这些结果也优于目前已报道的最佳性能。

✨ 主要特性

能够对现代希伯来语用户生成内容进行情感极性检测和情感提取。
在极性分类和多数情感检测任务中表现出色。

📚 详细文档

情感用户生成内容数据描述

我们的用户生成内容数据包含了从 2020 年 1 月至 2020 年 8 月期间，以色列 3 家主要新闻网站上新闻文章的评论。数据总大小约为 150 MB，包含超过 700 万个单词和 35 万条句子。

约 2000 条句子由众包人员（每条句子有 3 - 10 名标注人员）进行标注，标注内容包括整体情感倾向（极性）和八种情感：愤怒、厌恶、期待、恐惧、喜悦、悲伤、惊讶和信任。

每种情感在句子中出现的比例如下表所示：

属性	详情
愤怒	0.78
厌恶	0.83
期待	0.58
恐惧	0.45
喜悦	0.12
悲伤	0.59
惊讶	0.17
信任	0.11
情感倾向	0.25

性能表现

情感识别

情感	F1 分数	精确率	召回率
愤怒	0.96	0.99	0.93
厌恶	0.97	0.98	0.96
期待	0.82	0.80	0.87
恐惧	0.79	0.88	0.72
喜悦	0.90	0.97	0.84
悲伤	0.90	0.86	0.94
惊讶	0.40	0.44	0.37
信任	0.83	0.86	0.80

以上指标针对正类（即文本中反映出该情感）。

情感倾向（极性）分析

类别	精确率	召回率	F1 分数
中性	0.83	0.56	0.67
积极	0.96	0.92	0.94
消极	0.97	0.99	0.98
准确率	-	-	0.97
宏平均	0.92	0.82	0.86
加权平均	0.96	0.97	0.96

情感倾向（极性）分类模型也可在 AWS 上使用！更多信息请访问 AWS 的 GitHub 仓库。

💻 使用示例

基础用法

情感识别模型

可以在 Hugging Face Spaces 上找到在线模型，也可以使用 Colab 笔记本。

# !pip install pyplutchik==0.0.7
# !pip install transformers==4.14.1

!git clone https://github.com/avichaychriqui/HeBERT.git
from HeBERT.src.HebEMO import *
HebEMO_model = HebEMO()

HebEMO_model.hebemo(input_path = 'data/text_example.txt')
# return analyzed pandas.DataFrame  

hebEMO_df = HebEMO_model.hebemo(text='החיים יפים ומאושרים', plot=True)

示例图片

情感分类模型（仅极性）

from transformers import AutoTokenizer, AutoModel, pipeline

tokenizer = AutoTokenizer.from_pretrained("avichr/heBERT_sentiment_analysis") #same as 'avichr/heBERT' tokenizer
model = AutoModel.from_pretrained("avichr/heBERT_sentiment_analysis")

# how to use?
sentiment_analysis = pipeline(
    "sentiment-analysis",
    model="avichr/heBERT_sentiment_analysis",
    tokenizer="avichr/heBERT_sentiment_analysis",
    return_all_scores = True
)

sentiment_analysis('אני מתלבט מה לאכול לארוחת צהריים')	
>>>  [[{'label': 'neutral', 'score': 0.9978172183036804},
>>>  {'label': 'positive', 'score': 0.0014792329166084528},
>>>  {'label': 'negative', 'score': 0.0007035882445052266}]]

sentiment_analysis('קפה זה טעים')
>>>  [[{'label': 'neutral', 'score': 0.00047328314394690096},
>>>  {'label': 'possitive', 'score': 0.9994067549705505},
>>>  {'label': 'negetive', 'score': 0.00011996887042187154}]]

sentiment_analysis('אני לא אוהב את העולם')
>>>  [[{'label': 'neutral', 'score': 9.214012970915064e-05}, 
>>>  {'label': 'possitive', 'score': 8.876807987689972e-05}, 
>>>  {'label': 'negetive', 'score': 0.9998190999031067}]]

📄 许可证

文档中未提及相关许可证信息。

🔗 联系我们

Avichay Chriqui
Inbal yahav
The Coller Semitic Languages AI Lab

感谢使用！ תודה， شكرا

📝 引用说明

如果您使用了此模型，请按以下格式引用我们的工作： Chriqui, A., & Yahav, I. (2022). HeBERT & HebEMO: a Hebrew BERT Model and a Tool for Polarity Analysis and Emotion Recognition. INFORMS Journal on Data Science, forthcoming.

@article{chriqui2021hebert,
  title={HeBERT \& HebEMO: a Hebrew BERT Model and a Tool for Polarity Analysis and Emotion Recognition},
  author={Chriqui, Avihay and Yahav, Inbal},
  journal={INFORMS Journal on Data Science},
  year={2022}
}