许可协议: cc-by-nc-4.0
语言:
- 英文
标签:
- 金融
- 鹰派鸽派分类
管道标签: 文本分类
示例:
- 文本: "此类指引意味着,若事态发展显示通胀上升迹象,应立即实施紧缩政策。"
- 文本: "国际货币基金组织预测2019年全球经济增长将是金融危机以来最缓慢的。"
用于FOMC鹰派-鸽派-中性分类任务的微调模型
本页面包含ACL 2023论文《万亿级词汇:新型金融数据集、任务与市场分析》的模型。该研究由佐治亚理工学院金融科技创新实验室完成。该实验室是美国东南部金融教育、研究与产业的中心枢纽。
论文详见SSRN
标签释义
LABEL_2: 中性
LABEL_1: 鹰派
LABEL_0: 鸽派
使用指南(Python代码)
from transformers import pipeline
from transformers import AutoTokenizer, AutoModelForSequenceClassification, AutoConfig
tokenizer = AutoTokenizer.from_pretrained("gtfintechlab/FOMC-RoBERTa", do_lower_case=True, do_basic_tokenize=True)
model = AutoModelForSequenceClassification.from_pretrained("gtfintechlab/FOMC-RoBERTa", num_labels=3)
config = AutoConfig.from_pretrained("gtfintechlab/FOMC-RoBERTa")
classifier = pipeline('text-classification', model=model, tokenizer=tokenizer, config=config, device=0, framework="pt")
results = classifier(["此类指引意味着,若事态发展显示通胀上升迹象,应立即实施紧缩政策。",
"国际货币基金组织预测2019年全球经济增长将是金融危机以来最缓慢的。"],
batch_size=128, truncation="only_first")
print(results)
数据集
所有标注数据集及3种随机种子的训练-测试划分详见GitHub页面
引用与联系方式
引用
若使用任何代码、数据或模型,请引用我们的论文。
@inproceedings{shah-etal-2023-trillion,
title = "万亿级词汇:新型金融数据集、任务与市场分析",
author = "Shah, Agam and
Paturi, Suvan and
Chava, Sudheer",
booktitle = "第61届计算语言学协会年会论文集(第一卷:长论文)",
month = jul,
year = "2023",
address = "加拿大多伦多",
publisher = "计算语言学协会",
url = "https://aclanthology.org/2023.acl-long.368",
doi = "10.18653/v1/2023.acl-long.368",
pages = "6664--6679",
abstract = "联邦公开市场委员会(FOMC)的货币政策声明是金融市场回报的主要驱动因素。我们构建了最大规模的FOMC演讲、会议纪要和新闻发布会记录的分词标注数据集,以理解货币政策如何影响金融市场。本研究开发了鹰派-鸽派分类的新任务,并在提议的数据集上对多种预训练语言模型进行基准测试。使用性能最佳的模型(RoBERTa-large),我们构建了FOMC文件发布日的货币政策立场度量。为评估构建的度量,我们研究其对国债市场、股票市场和宏观经济指标的影响。我们的数据集、模型和代码已在Huggingface和GitHub上基于CC BY-NC 4.0协议公开。",
}
联系方式
如有任何问题请联系Agam Shah(ashah482[at]gatech[dot]edu)
GitHub: @shahagam4
个人网站: https://shahagam4.github.io/