G

Gbert Large Paraphrase Cosine

由 deutsche-telekom 开发
基于sentence-transformers框架的德语文本嵌入模型,可将文本映射到1024维向量空间,专为提升德语小样本文本分类性能设计。
下载量 21.03k
发布时间 : 1/13/2023
模型介绍
内容详情
替代品

模型简介

该模型基于deepset/gbert-large开发,使用余弦相似度作为度量标准,适用于德语句子相似度计算和小样本分类任务。

模型特点

高质量德语嵌入
基于严格筛选的德语回译释义数据集训练,确保语义表示质量
小样本优化
专为德语小样本学习场景设计,与SetFit框架兼容
余弦相似度优化
采用MultipleNegativesRankingLoss损失函数,以余弦相似度为度量标准

模型能力

德语文本嵌入
句子相似度计算
小样本文本分类

使用案例

文本分类
德语短文本分类
在标注数据有限的场景下进行德语短文本分类
在德语小样本基准测试中表现优异
语义搜索
德语文档检索
构建德语语义搜索引擎