I

Indic Sentence Similarity Sbert

由 l3cube-pune 开发
这是一个基于印度十种主要语言的STS数据集训练的IndicSBERT模型,适用于英语和多种印度语言,具备跨语言能力。
下载量 1,642
发布时间 : 3/4/2023
模型介绍
内容详情
替代品

模型简介

该模型是基于印度十种主要语言的STS数据集训练的句子相似度模型,支持英语、印地语、马拉地语、卡纳达语、泰米尔语、泰卢固语、古吉拉特语、奥里亚语、旁遮普语、马拉雅拉姆语和孟加拉语。作为MahaNLP项目的一部分发布。

模型特点

多语言支持
支持英语和印度十种主要语言的句子相似度计算
跨语言能力
能够在不同印度语言之间进行句子相似度比较
基于STS数据集训练
使用语义文本相似度(STS)数据集进行专门训练

模型能力

句子特征提取
句子相似度计算
跨语言句子比较

使用案例

自然语言处理
多语言文本匹配
比较不同印度语言表达的相似句子
跨语言信息检索
在不同语言的文档中查找相似内容