B

Bert Base Multilingual Cased Sentence

由 DeepPavlov 开发
基于多语言BERT的101种语言句子表征模型,通过均值池化词嵌入方法生成句子表征
下载量 56
发布时间 : 3/2/2022
模型介绍
内容详情
替代品

模型简介

该模型以多语言BERT为基础,在英语MultiNLI和多语言XNLI开发集上微调,用于生成多语言句子表征

模型特点

多语言支持
支持101种语言的句子表征生成
基于BERT架构
采用12层BERT架构,具有768隐藏单元和12头注意力机制
句子表征优化
通过均值池化词嵌入方法优化句子表征生成
跨语言微调
在英语MultiNLI和多语言XNLI开发集上进行微调

模型能力

多语言句子嵌入
跨语言语义相似度计算
句子级特征提取

使用案例

自然语言处理
跨语言语义搜索
在不同语言间进行语义相似的句子检索
多语言文本分类
利用句子表征进行多语言文本分类任务
跨语言信息检索
在不同语言的文档中检索相关信息