Businessbert
面向商业应用的行业敏感语言模型,基于商业通信语料库进行预训练,整合行业信息以优化商业相关NLP任务。
下载量 1,782
发布时间 : 1/12/2024
模型简介
商业BERT是一个专注于商业领域的语言模型,通过预训练整合行业信息,适用于序列分类、命名实体识别、情感分析等商业相关NLP任务。
模型特点
行业敏感预训练
通过行业分类(IC)作为额外预训练目标,嵌入行业信息,提升商业领域任务表现。
大规模商业语料库
使用22.3亿词元的商业通信语料库进行预训练,包含年度披露文件、公司网站内容和科学文献。
多任务适配
支持多种商业相关NLP任务,包括分类、命名实体识别、情感分析和问答系统。
模型能力
文本分类
命名实体识别
情感分析
问答系统
行业分类
使用案例
金融分析
财务风险评估
分析公司披露文件以评估财务风险
F1分数85.89,准确率87.02
流动比率分析
理解并解释财务指标如流动比率
市场研究
新闻标题主题分类
对商业新闻标题进行分类
F1分数75.06,准确率67.71
行业分类
识别公司所属行业
投资决策
情感分析
分析金融文本的情感倾向
FiQA数据集均方误差0.0758,平均绝对误差0.202
股票推文分析
分析社交媒体上关于股票的讨论
F1分数69.14,准确率69.54
精选推荐AI模型
Qwen2.5 VL 7B Abliterated Caption It I1 GGUF
Apache-2.0
Qwen2.5-VL-7B-Abliterated-Caption-it的量化版本,支持多语言图像描述任务。
图像生成文本
Transformers 支持多种语言

Q
mradermacher
167
1
Nunchaku Flux.1 Dev Colossus
其他
Colossus Project Flux 的 Nunchaku 量化版本,旨在根据文本提示生成高质量图像。该模型在优化推理效率的同时,将性能损失降至最低。
图像生成 英语
N
nunchaku-tech
235
3
Qwen2.5 VL 7B Abliterated Caption It GGUF
Apache-2.0
这是一个基于Qwen2.5-VL-7B模型的静态量化版本,专注于图像描述生成任务,支持多种语言。
图像生成文本
Transformers 支持多种语言

Q
mradermacher
133
1
Olmocr 7B 0725 FP8
Apache-2.0
olmOCR-7B-0725-FP8是基于Qwen2.5-VL-7B-Instruct模型,使用olmOCR-mix-0225数据集微调后量化为FP8版本的文档OCR模型。
图像生成文本
Transformers 英语

O
allenai
881
3
Lucy 128k GGUF
Apache-2.0
Lucy-128k是基于Qwen3-1.7B开发的专注于代理式网络搜索和轻量级浏览的模型,在移动设备上也能高效运行。
大型语言模型
Transformers 英语

L
Mungert
263
2