J

Jina Embeddings V2 Base Zh

由 silverjam 开发
Jina Embeddings V2 Base 是一个针对中文优化的句子嵌入模型,能够将文本转换为高维向量表示,用于计算句子相似度和特征提取。
下载量 63
发布时间 : 6/5/2024
模型介绍
内容详情
替代品

模型简介

该模型专注于中文文本的嵌入表示,支持多种自然语言处理任务,如句子相似度计算、文本分类和聚类等。

模型特点

中文优化
专门针对中文文本进行优化,提供更准确的中文句子嵌入表示。
多任务支持
支持多种自然语言处理任务,包括句子相似度计算、文本分类和聚类等。
高性能
在多个中文基准测试中表现出色,特别是在句子相似度任务上。

模型能力

句子嵌入生成
文本特征提取
句子相似度计算
文本分类
文本聚类
信息检索

使用案例

信息检索
医疗问答检索
在医疗问答系统中用于检索相关问题和答案
在CMedQA数据集上表现出色,MAP达到83.74
文本相似度
问答对匹配
判断问题和答案之间的相关性
在AFQMC数据集上余弦相似度皮尔逊值为48.51
文本分类
商品评论分类
对中文商品评论进行情感或主题分类
在Amazon中文评论分类任务上准确率达到34.94%