语言: 英语
标签:
- 文本分类
- PyTorch
- RoBERTa
- 情感分析
数据集:
- go_emotions
许可证: MIT
小部件示例:
该模型针对GoEmotions数据集训练,该数据集包含标注了28种情感的58k条Reddit评论
- 情感类别包括: 钦佩、有趣、愤怒、烦恼、赞同、关心、困惑、好奇、渴望、失望、反对、厌恶、尴尬、兴奋、恐惧、感激、悲伤、快乐、爱、紧张、乐观、自豪、领悟、宽慰、悔恨、伤心、惊讶 + 中性
训练细节:
- 训练脚本在此处提供: https://github.com/bsinghpratap/roberta_train_goEmotion
- 如果您在运行模型时遇到问题,请在仓库中提交issue,我会尽快回复。
- 该模型在大多数情感上表现良好,除了: '渴望'、'厌恶'、'尴尬'、'兴奋'、'恐惧'、'悲伤'、'紧张'、'自豪'、'宽慰'、'悔恨'、'惊讶'
- 我将尝试进一步微调模型,如果RoBERTa取得更好的性能,会在此更新。
- 每个文本数据点可能有多个标签。大多数训练集数据只有一个标签: Counter({1: 36308, 2: 6541, 3: 532, 4: 28, 5: 1})。因此目前我只使用了每个数据点的第一个标签。虽然不理想,但效果尚可。
模型性能
============================================================
情感: 钦佩
============================================================
GoEmotions论文: 0.65
RoBERTa: 0.62
支持数: 504
============================================================
情感: 有趣
============================================================
GoEmotions论文: 0.80
RoBERTa: 0.78
支持数: 252
============================================================
情感: 愤怒
============================================================
GoEmotions论文: 0.47
RoBERTa: 0.44
支持数: 197
============================================================
情感: 烦恼
============================================================
GoEmotions论文: 0.34
RoBERTa: 0.22
支持数: 286
============================================================
情感: 赞同
============================================================
GoEmotions论文: 0.36
RoBERTa: 0.31
支持数: 318
============================================================
情感: 关心
============================================================
GoEmotions论文: 0.39
RoBERTa: 0.24
支持数: 114
============================================================
情感: 困惑
============================================================
GoEmotions论文: 0.37
RoBERTa: 0.29
支持数: 139
============================================================
情感: 好奇
============================================================
GoEmotions论文: 0.54
RoBERTa: 0.48
支持数: 233
============================================================
情感: 失望
============================================================
GoEmotions论文: 0.28
RoBERTa: 0.18
支持数: 127
============================================================
情感: 反对
============================================================
GoEmotions论文: 0.39
RoBERTa: 0.26
支持数: 220
============================================================
情感: 感激
============================================================
GoEmotions论文: 0.86
RoBERTa: 0.84
支持数: 288
============================================================
情感: 快乐
============================================================
GoEmotions论文: 0.51
RoBERTa: 0.47
支持数: 116
============================================================
情感: 爱
============================================================
GoEmotions论文: 0.78
RoBERTa: 0.68
支持数: 169
============================================================
情感: 中性
============================================================
GoEmotions论文: 0.68
RoBERTa: 0.61
支持数: 1606
============================================================
情感: 乐观
============================================================
GoEmotions论文: 0.51
RoBERTa: 0.52
支持数: 120
============================================================
情感: 领悟
============================================================
GoEmotions论文: 0.21
RoBERTa: 0.15
支持数: 109
============================================================
情感: 伤心
============================================================
GoEmotions论文: 0.49
RoBERTa: 0.42
支持数: 108