M

Modernce Large Sts

由 dleemiller 开发
高性能的语义相似度评估模型,专为文本比对任务优化
下载量 25
发布时间 : 1/13/2025
模型介绍
内容详情
替代品

模型简介

该模型是基于ModernBERT-large架构的交叉编码器,专门用于评估文本对的语义相似度,支持长文本处理并具有卓越的评估精度。

模型特点

卓越性能
在STS-Benchmark测试集上取得皮尔逊系数0.9256与斯皮尔曼系数0.9215
高效架构
基于ModernBERT-large设计,推理速度更快
长文本支持
支持最长8192个token的序列处理,特别适合大语言模型输出评估
复合训练
先通过wiki-sim数据集预训练,再经stsb数据集微调

模型能力

语义相似度评估
文本对评分
长文本处理

使用案例

自然语言处理
大语言模型输出评估
评估LLM生成文本与参考文本的语义相似度
提供0-1范围的精确相似度评分
问答系统
判断问题与候选答案的匹配程度
提高问答系统的准确率