R

Roberta Base Use Qa Theseus Bg

由 rmihaylov 开发
这是一个多语言Roberta模型,可用于生成保加利亚语句子的嵌入向量。基于Sentence-BERT思想训练,教师模型为谷歌的USE模型。
下载量 15
发布时间 : 4/18/2022
模型介绍
内容详情
替代品

模型简介

该模型用于生成保加利亚语句子的嵌入向量,适用于句子相似度计算等任务。通过渐进式模块替换技术进行了模型压缩。

模型特点

多语言支持
支持保加利亚语和英语的句子嵌入生成
区分大小写
模型区分大小写,如'bulgarian'和'Bulgarian'会被视为不同词汇
模型压缩
通过渐进式模块替换技术进行了模型压缩
基于翻译对训练
使用保加利亚语-英语平行语料库训练,翻译句子映射到相同向量空间

模型能力

保加利亚语句子嵌入生成
英语句子嵌入生成
句子相似度计算

使用案例

信息检索
问答系统
用于查找与问题最相关的答案
示例中展示了如何计算问题与候选答案的相似度
文本匹配
相似句子识别
识别语义相似的句子