S

Sentence Camembert Base

由 Lajavaness 开发
基于CamemBERT的法语句子嵌入模型,通过增强SBERT方法在stsb数据集上微调,实现最先进的法语句子相似度计算
下载量 1,041
发布时间 : 10/25/2023
模型介绍
内容详情
替代品

模型简介

该模型专门用于计算法语句子之间的语义相似度,基于CamemBERT架构并通过增强SBERT方法优化,在多个法语文本相似度基准测试中表现优异

模型特点

增强SBERT训练方法
采用先进的增强SBERT训练策略,结合CrossEncoder和大型模型进行配对采样优化
多基准测试优异表现
在STS-B、STS12-fr等多个法语文本相似度基准测试中取得领先成绩
高效参数规模
仅110M参数即达到与更大模型相当甚至更好的性能

模型能力

法语句子嵌入
句子相似度计算
语义文本匹配

使用案例

信息检索
相似文档检索
在法语文档库中查找语义相似的文档
提高检索准确率和召回率
问答系统
问题相似度匹配
识别用户问题与知识库问题的语义相似度
提升问答系统准确率
文本聚类
法语文本聚类
基于语义相似度对法语文本进行自动分组
实现无监督的文本分类