部件:
- 文本: >-
没关系你们不认识这支印尼乐队。但别开玩笑。因为他们敢大声唱出活动人士如何被刺杀、投毒、电椅处决和空中杀害。那些牺牲生命只为让你们今天能无忧无虑发推文的人
示例标题: 示例1
输出:
- 标签: 负面
得分: 0.2964
- 标签: 中性
得分: 0.067
- 标签: 正面
得分: 0.6969
- 文本: >-
只要存在想当救世主的群体,政府就有理由制定大量法规=滋生腐败/权力滥用。正义就是放松管制。
示例标题: 示例2
输出:
- 标签: 负面
得分: 0.971
- 标签: 中性
得分: 0.0165
- 标签: 正面
得分: 0.126
- 文本: >-
当你的支持者说好😹加油✌🏽好😹加油✌🏽但你却在笑🤣这不尊重😠拜托别忘了吃午饭😁免费的拜托😋😹✌🏽
示例标题: 示例3
输出:
- 标签: 负面
得分: 0.6457
- 标签: 中性
得分: 0.048
- 标签: 正面
得分: 0.3063
- 文本: >-
求分享些学生远程/自由职业的招聘信息,超想赚点零花钱补贴宿舍开销
示例标题: 示例4
输出:
- 标签: 负面
得分: 0.0544
- 标签: 中性
得分: 0.6973
- 标签: 正面
得分: 0.2482
- 文本: >-
现在找工作太难了。连总统的孩子都得靠老爸帮忙找工作
示例标题: 示例5
输出:
- 标签: 负面
得分: 0.9852
- 标签: 中性
得分: 0.0116
- 标签: 正面
得分: 0.0032
- 文本: >-
印尼广播委员会(KPI)要求电视节目以教育性和准确性展现警方正面形象。中央KPI主席Ubaidillah在小组讨论中传达了这一要求
示例标题: 示例6
输出:
- 标签: 中性
得分: 0.9932
- 标签: 正面
得分: 0.0063
- 标签: 负面
得分: 0.0005
- 文本: >-
别说玩笑推文了...有时我读到正常推文觉得'哦有意思'就点赞/转发,然后去睡觉,第二天那条推文就被围攻了。我开始想,到底是我觉得所有事都有趣且任何人都可能对...还是...所有人都变得太敏感
示例标题: 示例7
输出:
- 标签: 负面
得分: 0.5531
- 标签: 中性
得分: 0.4426
- 标签: 正面
得分: 0.0043
库名称: transformers
许可证: mit
语言:
模型卡片
模型详情
模型描述
该模型是基于IndoBertweet-base-uncased微调的印尼语情感分析模型,可将情感分为三类:负面、正面和中性。其训练数据涵盖推特等社交平台对政治、灾难、教育等多主题的讨论,通过Optuna进行超参数优化,并以准确率、F1值、精确率和召回率作为评估指标。
偏差与局限
需注意模型训练数据可能带来分类偏差,可能继承训练数据中的社会文化偏见,且对未覆盖的新近事件准确性较低。三分类框架也可能无法完全捕捉复杂情感语境。使用时应充分考虑这些偏差因素。
评估结果
训练过程采用Optuna进行超参数优化,最大训练10个epoch,批次大小16,基于准确率保存最佳模型,并设置早停机制(耐心值3)防止过拟合。
训练轮次 |
训练损失 |
验证损失 |
准确率 |
F1值 |
精确率 |
召回率 |
引用文献
@misc{Ardiyanto_Mikhael_2024,
author = {Mikhael Ardiyanto},
title = {Aardiiiiy/indobertweet-base-Indonesian-sentiment-analysis},
year = {2024},
URL = {https://huggingface.co/Aardiiiiy/indobertweet-base-Indonesian-sentiment-analysis},
publisher = {Hugging Face}
}