L

Labse

由 setu4993 开发
LaBSE是一个基于BERT的多语言句子嵌入模型,支持109种语言,适用于句子相似度计算和双语文本检索。
下载量 18.74k
发布时间 : 3/2/2022
模型介绍
内容详情
替代品

模型简介

该模型通过结合掩码语言建模和翻译语言建模进行预训练,能够生成高质量的多语言句子嵌入,特别适合跨语言文本匹配任务。

模型特点

多语言支持
支持109种语言的句子嵌入,实现跨语言文本匹配
高质量嵌入
通过掩码语言建模和翻译语言建模联合训练,生成高质量的句子表示
跨语言检索
特别适合双语文本检索等跨语言应用场景

模型能力

多语言句子嵌入
跨语言文本相似度计算
双语文本检索
多语言语义匹配

使用案例

信息检索
跨语言文档检索
在不同语言的文档集合中查找语义相似的文档
可有效匹配不同语言中表达相同概念的文档
机器翻译
翻译质量评估
通过比较源语言和目标语言句子的嵌入相似度来评估翻译质量
提供与人工评估高度相关的自动评估指标