Trading-Hero-LLM开源金融情感分析模型 - 精准优化金融文本情感分类

首页

Trading Hero LLM

由 fuchenru 开发

基于FinBERT微调的金融情感分析模型，专为金融文本情感分类优化

文本分类

Transformers

开源协议:MIT #金融情感分析 #FinBERT微调 #财经文本分类

下载量 313

发布时间 : 5/25/2024

模型简介

该模型是基于FinBERT微调的版本，专门用于金融领域的情感分析任务，能够识别金融文本中的中性、积极和消极情绪。

模型特点

金融领域优化

在大型金融语料库上预训练，针对金融文本特点进行优化

高准确率

测试准确率达到90.8%，F1值91.3%，在金融情感分析任务中表现优异

三分类情感分析

能够区分中性、积极和消极三种金融情感倾向

模型能力

金融文本情感分类

财经新闻情绪分析

市场情绪预测

使用案例

金融分析

财经新闻情绪监测

分析财经新闻和市场评论的情绪倾向

准确识别中性、积极和消极情绪

投资决策支持

为投资者提供市场情绪分析参考

帮助判断市场整体情绪走向

风险管理

市场风险预警

通过分析金融文本情绪变化预测潜在风险

提前发现市场情绪转变信号

🚀 交易英雄金融情感分析

本模型是一个金融情感分析模型，基于预训练的金融领域模型进行微调，能有效处理金融领域的自然语言处理任务，为金融分析和研究提供有力支持。

🚀 快速开始

代码示例

import torch
from transformers import AutoTokenizer, AutoModelForSequenceClassification, pipeline
tokenizer = AutoTokenizer.from_pretrained("fuchenru/Trading-Hero-LLM")
model = AutoModelForSequenceClassification.from_pretrained("fuchenru/Trading-Hero-LLM")
nlp = pipeline("text-classification", model=model, tokenizer=tokenizer)
# 预处理输入文本
def preprocess(text, tokenizer, max_length=128):
    inputs = tokenizer(text, truncation=True, padding='max_length', max_length=max_length, return_tensors='pt')
    return inputs

# 执行预测的函数
def predict_sentiment(input_text):
    # 对输入文本进行分词
    inputs = tokenizer(input_text, return_tensors="pt", truncation=True, padding=True)

    # 进行推理
    with torch.no_grad():
        outputs = model(**inputs)

    # 获取预测标签
    predicted_label = torch.argmax(outputs.logits, dim=1).item()

    # 将预测标签映射到原始标签
    label_map = {0: 'neutral', 1: 'positive', 2: 'negative'}
    predicted_sentiment = label_map[predicted_label]

    return predicted_sentiment

stock_news = [
    "Market analysts predict a stable outlook for the coming weeks.",
    "The market remained relatively flat today, with minimal movement in stock prices.",
    "Investor sentiment improved following news of a potential trade deal.",
    # 此处省略部分内容
]


for i in stock_news:
    predicted_sentiment = predict_sentiment(i)
    print("Predicted Sentiment:", predicted_sentiment)

Predicted Sentiment: neutral
Predicted Sentiment: neutral
Predicted Sentiment: positive

✨ 主要特性

本模型是 FinBERT 的微调版本，FinBERT 是一个在金融文本上预训练的 BERT 模型。
微调过程使模型适应特定的金融自然语言处理任务，增强了其在特定领域情感分析应用中的性能。

📦 安装指南

文档未提及安装步骤，故跳过此章节。

💻 使用示例

基础用法

import torch
from transformers import AutoTokenizer, AutoModelForSequenceClassification, pipeline
tokenizer = AutoTokenizer.from_pretrained("fuchenru/Trading-Hero-LLM")
model = AutoModelForSequenceClassification.from_pretrained("fuchenru/Trading-Hero-LLM")
nlp = pipeline("text-classification", model=model, tokenizer=tokenizer)
# 预处理输入文本
def preprocess(text, tokenizer, max_length=128):
    inputs = tokenizer(text, truncation=True, padding='max_length', max_length=max_length, return_tensors='pt')
    return inputs

# 执行预测的函数
def predict_sentiment(input_text):
    # 对输入文本进行分词
    inputs = tokenizer(input_text, return_tensors="pt", truncation=True, padding=True)

    # 进行推理
    with torch.no_grad():
        outputs = model(**inputs)

    # 获取预测标签
    predicted_label = torch.argmax(outputs.logits, dim=1).item()

    # 将预测标签映射到原始标签
    label_map = {0: 'neutral', 1: 'positive', 2: 'negative'}
    predicted_sentiment = label_map[predicted_label]

    return predicted_sentiment

stock_news = [
    "Market analysts predict a stable outlook for the coming weeks.",
    "The market remained relatively flat today, with minimal movement in stock prices.",
    "Investor sentiment improved following news of a potential trade deal.",
    # 此处省略部分内容
]


for i in stock_news:
    predicted_sentiment = predict_sentiment(i)
    print("Predicted Sentiment:", predicted_sentiment)

高级用法

文档未提及高级用法相关内容，故跳过此部分。

📚 详细文档

主要用户

金融分析师、自然语言处理研究人员以及处理金融数据的开发人员。

训练数据

微调数据集：该模型在一个自定义的金融通信文本数据集上进行了微调。数据集分为训练集、验证集和测试集，具体如下：
- 训练集：10,918,272 个标记
- 验证集：1,213,184 个标记
- 测试集：1,347,968 个标记
预训练数据集：FinBERT 在一个总计 49 亿个标记的大型金融语料库上进行了预训练，包括：
- 公司报告（10 - K 和 10 - Q）：25 亿个标记
- 财报电话会议记录：13 亿个标记
- 分析师报告：11 亿个标记

评估指标

测试准确率 = 0.908469
测试精确率 = 0.927788
测试召回率 = 0.908469
测试 F1 值 = 0.913267
标签含义：0 -> 中性；1 -> 积极；2 -> 消极

🔧 技术细节

文档未提供足够详细的技术实现细节（未超过 50 字），故跳过此章节。

📄 许可证

本项目采用 MIT 许可证。

引用

@misc{yang2020finbert,
    title={FinBERT: A Pretrained Language Model for Financial Communications},
    author={Yi Yang and Mark Christopher Siy UY and Allen Huang},
    year={2020},
    eprint={2006.08097},
    archivePrefix={arXiv},
    }