R

Roberta Base Nli Stsb Theseus Bg

由 rmihaylov 开发
这是一个多语言Roberta模型,可用于生成保加利亚语句子的嵌入向量,基于Sentence-BERT理念训练,支持保加利亚语和英语。
下载量 14
发布时间 : 4/18/2022
模型介绍
内容详情
替代品

模型简介

该模型基于Sentence-BERT理念训练,核心思想是翻译后的句子应与原句在向量空间中映射到相同位置。模型区分大小写,后期通过渐进式模块替换技术进行了压缩优化。

模型特点

多语言支持
支持保加利亚语和英语的句子嵌入生成
区分大小写
能够区分单词的大小写形式,如'bulgarian'和'Bulgarian'会被视为不同词汇
渐进式模块替换优化
通过渐进式模块替换技术进行了压缩优化,提高了模型效率
基于Sentence-BERT理念
采用Sentence-BERT的训练方法,使翻译对在向量空间中映射到相近位置

模型能力

句子嵌入生成
跨语言句子相似度计算
文本语义匹配

使用案例

信息检索
跨语言文档检索
使用保加利亚语查询检索相关英语文档
问答系统
相似问题匹配
在问答系统中匹配语义相似的保加利亚语问题
如示例所示,能准确识别与'饼干成分'最相关的问题