F

Financial Rag Matryoshka

由 rbhatia46 开发
基于Alibaba-NLP/gte-large-en-v1.5微调的金融专用句子转换器模型,专注于金融文档检索任务
下载量 17.08k
发布时间 : 7/8/2024
模型介绍
内容详情
替代品

模型简介

该模型能将句子和段落映射到1024维密集向量空间,可用于语义文本相似度、语义搜索、复述挖掘、文本分类、聚类等任务,特别优化了金融领域的表现

模型特点

金融领域优化
在保持通用性能的同时,特别针对金融文档检索任务进行了优化
高维向量空间
能将文本映射到1024维密集向量空间,捕捉丰富的语义信息
长文本处理
支持最大8192个token的序列长度,适合处理长文档
Matryoshka损失函数
使用MatryoshkaLoss配合MultipleNegativesRankingLoss进行训练,提升模型性能

模型能力

语义文本相似度计算
语义搜索
复述挖掘
文本分类
文本聚类
金融文档检索

使用案例

金融信息检索
金融机构报告检索
快速检索金融机构报告中的关键信息
在金融文档检索任务中表现出色
金融问答系统
构建基于语义匹配的金融问答系统
高准确率的语义匹配能力
通用文本处理
文档相似度计算
计算不同文档之间的语义相似度
文本聚类
对大量文本进行自动分类和聚类