L

Longformer Base 4096 Sentence Transformers All Nli Stsb Quora Nq

由 Leo1212 开发
这是一个基于allenai/longformer-base-4096微调的sentence-transformers模型,用于生成句子和段落的768维密集向量表示,适用于语义文本相似度、语义搜索等任务。
下载量 45
发布时间 : 4/25/2025
模型介绍
内容详情
替代品

模型简介

该模型将句子和段落映射到768维密集向量空间,可用于语义文本相似度、语义搜索、复述挖掘、文本分类、聚类等任务。

模型特点

长文本处理能力
基于Longformer架构,支持最长4098个token的序列长度,适合处理长文档和段落。
多任务训练
在多个数据集(all-nli、stsb、quora、natural-questions)上联合训练,增强了模型的泛化能力。
多损失函数优化
使用MultipleNegativesRankingLoss、SoftmaxLoss和CoSENTLoss等多种损失函数进行优化,提升不同任务的表现。

模型能力

语义文本相似度计算
语义搜索
复述挖掘
文本分类
文本聚类
特征提取

使用案例

信息检索
相似问题匹配
在问答系统中查找与用户提问语义相似的问题
可准确匹配Quora等平台上的重复问题
内容推荐
相关内容推荐
基于内容相似度推荐文章或产品
可提高用户参与度和转化率
文本分析
文本聚类
将大量文档按语义相似度分组
可用于主题建模和文档组织