🚀 DistilBERT 针对金融情感分析的微调模型
本模型专为金融领域的情感分析而设计,微调自 DistilBERT 基础模型,能有效对金融文本进行情感分类,为金融数据处理提供了强大支持。
🚀 快速开始
你可以使用 Hugging Face 的 transformers
库加载并使用该模型,示例代码如下:
import torch
from transformers import AutoModelForSequenceClassification, AutoTokenizer
tokenizer = AutoTokenizer.from_pretrained("AnkitAI/distilbert-base-uncased-financial-news-sentiment-analysis")
model = AutoModelForSequenceClassification.from_pretrained("AnkitAI/distilbert-base-uncased-financial-news-sentiment-analysis")
text = "The company's revenue declined significantly due to market competition."
inputs = tokenizer(text, return_tensors="pt")
with torch.no_grad():
outputs = model(**inputs)
logits = outputs.logits
predicted_class_id = logits.argmax().item()
label_mapping = {0: "Negative", 1: "Neutral", 2: "Positive"}
predicted_label = label_mapping[predicted_class_id]
print(f"Text: {text}")
print(f"Predicted Sentiment: {predicted_label}")
✨ 主要特性
📚 详细文档
模型性能
该模型训练了 5 个轮次,并在占数据集 20% 的保留测试集上进行评估。
评估指标
轮次 |
评估损失 |
评估准确率 |
1 |
0.2210 |
94.26% |
2 |
0.1997 |
95.81% |
3 |
0.1719 |
96.69% |
4 |
0.2073 |
96.03% |
5 |
0.1941 |
96.69% |
训练指标
- 最终训练损失:0.0797
- 总训练时间:约 3869 秒(约 1.07 小时)
- 每秒训练样本数:2.34
- 每秒训练步数:0.147
训练过程
数据
- 数据集:Financial PhraseBank
- 配置:
sentences_allagree
(所有标注者对情感达成一致的句子)
- 数据集大小:2264 个句子
- 数据划分:80% 用于训练(1811 个样本),20% 用于测试(453 个样本)
模型配置
超参数
- 轮次数量:5
- 批量大小:训练时为 16,评估时为 64
- 学习率:5e - 5
- 优化器:AdamW
- 评估指标:准确率
- 随机种子:42(用于可重复性)
📄 许可证
本模型采用 Apache 2.0 许可证。你可以在应用程序中自由使用、修改和分发此模型。
📚 引用
如果你在研究或应用中使用此模型,请按以下方式引用:
@misc{AnkitAI_2024_financial_sentiment_model,
title={DistilBERT Fine-Tuned for Financial Sentiment Analysis},
author={Ankit Aglawe},
year={2024},
howpublished={\url{https://huggingface.co/AnkitAI/distilbert-base-uncased-financial-news-sentiment-analysis}},
}
🙏 致谢
- Hugging Face:提供 Transformers 库和模型托管服务。
- 数据提供者:感谢 Financial PhraseBank 数据集的创建者。
- 社区:感谢开源社区的持续支持和贡献。
📞 联系信息
如有问题、反馈或合作机会,请联系: