T

Text2vec Base Multilingual

由 barisaydin 开发
一个支持多语言的文本向量化模型,专注于句子相似度计算和特征提取任务
下载量 17
发布时间 : 9/20/2023
模型介绍
内容详情
替代品

模型简介

该模型是一个多语言文本嵌入模型,能够将不同语言的文本转换为向量表示,主要用于句子相似度计算、文本分类和聚类等任务。支持包括中文、英文、德语、法语等多种语言。

模型特点

多语言支持
支持包括中文、英文、德语、法语等多种语言的文本向量化
句子相似度计算
专门优化用于计算不同句子之间的语义相似度
跨语言能力
能够处理跨语言的文本相似度比较任务
高效特征提取
可以快速提取文本的语义特征表示

模型能力

文本向量化
句子相似度计算
跨语言文本比较
文本特征提取
文本分类
文本聚类

使用案例

电子商务
多语言评论分类
对亚马逊不同语言的商品评论进行分类
在MTEB亚马逊多语言评论分类任务中,英文准确率33.13%,中文准确率32.52%
评论极性分析
分析商品评论的情感极性(正面/负面)
在MTEB亚马逊极性分类任务中准确率达到66.10%
意图识别
多语言意图分类
识别用户查询的意图类别
在MTEB MTOP意图分类任务中,英文准确率62.79%,德语55.29%
学术研究
论文聚类
对学术论文进行主题聚类
在MTEB arXiv论文聚类P2P任务中V测量值32.32%