B

BERTA

由 sergeyzh 开发
BERTA是通过蒸馏FRIDA模型的嵌入向量到LaBSE-ru-turbo获得的,用于计算俄语和英语句子的嵌入向量,支持多种前缀任务。
下载量 7,089
发布时间 : 3/10/2025
模型介绍
内容详情
替代品

模型简介

BERTA模型是一个用于计算俄语和英语句子嵌入向量的预训练模型,通过蒸馏FRIDA模型的嵌入向量到LaBSE-ru-turbo获得,保留了俄英句子嵌入和前缀功能。

模型特点

多前缀支持
支持多种前缀任务,如语义相似度、复述识别、自然语言推理等,通过不同前缀优化任务表现。
蒸馏优化
通过蒸馏FRIDA模型的嵌入向量到LaBSE-ru-turbo,保留了高性能的同时降低了模型复杂度。
多语言支持
支持俄语和英语的句子嵌入计算,适用于跨语言任务。

模型能力

计算句子嵌入向量
语义文本相似度计算
复述识别
自然语言推理
情感分析
毒性识别

使用案例

文本分类
新闻标题分类
对新闻标题进行分类,准确率高达0.891。
准确率0.891
电影评论分类
对电影评论进行情感分类,准确率0.678。
准确率0.678
信息检索
新闻检索
用于新闻检索任务,NDCG@10达到0.816。
NDCG@10 0.816
问答检索
用于问答检索任务,NDCG@10达到0.710。
NDCG@10 0.710
语义相似度
俄语STS基准
计算俄语句子的语义相似度,皮尔逊相关系数0.822。
皮尔逊相关系数0.822