gbert-large-paraphrase-euclidean开源德语句子嵌入模型

首页

Gbert Large Paraphrase Euclidean

由 deutsche-telekom 开发

基于sentence-transformers的德语句子嵌入模型，将文本映射到1024维向量空间，专为小样本分类优化

文本嵌入

Transformers

德语开源协议:MIT #德语句子相似度 #欧式距离优化 #小样本学习

下载量 19.03k

发布时间 : 1/13/2023

模型简介

该模型是基于deepset/gbert-large构建的德语句子嵌入模型，使用欧式距离作为相似度度量，特别设计用于与SetFit结合提升德语小样本分类性能。

模型特点

欧式距离优化

使用BatchHardSoftMarginTripletLoss配合欧式距离进行训练，适合特定距离度量需求

高质量训练数据

基于严格筛选的德语回译和释义数据集，确保训练质量

小样本优化

特别设计用于提升德语小样本场景下的文本分类性能

孪生模型支持

提供余弦相似度版本作为互补选择（deutsche-telekom/gbert-large-paraphrase-cosine）

模型能力

德语文本嵌入

句子相似度计算

小样本学习

文本分类支持

使用案例

文本分类

小样本分类任务

在标注数据有限的情况下进行德语文本分类

在NLU小样本基准测试中表现优异

语义搜索

德语文档检索

基于语义相似度的德语文档搜索系统

🚀 德语BERT大模型释义欧几里得模型

这是一个 sentence-transformers 模型，它可以将句子和段落（文本）映射到一个1024维的密集向量空间中。该模型旨在与 SetFit 一起使用，以改进德语少样本的文本分类任务。它有一个兄弟模型 deutsche-telekom/gbert-large-paraphrase-cosine。

此模型基于 deepset/gbert-large 构建，非常感谢 deepset！

🚀 快速开始

该模型可用于德语少样本的文本分类任务，结合 SetFit 能取得更好的效果。

✨ 主要特性

基于 sentence-transformers 框架，可将文本映射到1024维的密集向量空间。
与 SetFit 结合使用，提升德语少样本的文本分类性能。
有一个兄弟模型 deutsche-telekom/gbert-large-paraphrase-cosine。

🔧 技术细节

训练

损失函数

我们使用了 BatchHardSoftMarginTripletLoss 作为损失函数，并采用欧几里得距离：

    train_loss = losses.BatchHardSoftMarginTripletLoss(
       model=model,
       distance_metric=BatchHardTripletLossDistanceFunction.eucledian_distance,
   )