ConGen-paraphrase-multilingual-mpnet-base-v2开源模型

首页

Congen Paraphrase Multilingual Mpnet Base V2

由 kornwtp 开发

这是一个基于ConGen框架的多语言句子嵌入模型，可将句子映射到768维向量空间，适用于语义搜索等任务。

文本嵌入

Transformers

开源协议:Apache-2.0 #多语言句子嵌入 #语义相似度计算 #768维向量空间

下载量 329

发布时间 : 12/6/2022

模型简介

该模型使用ConGen框架训练，能够将句子转换为768维的密集向量表示，主要用于计算句子相似度和语义搜索任务。

模型特点

多语言支持

支持包括泰语在内的多种语言处理

高维向量表示

将句子映射到768维的密集向量空间

基于ConGen框架

采用无监督控制与泛化蒸馏技术训练

模型能力

句子向量化

语义相似度计算

多语言文本处理

使用案例

信息检索

语义搜索

使用句子向量进行相似文档检索

自然语言处理

句子相似度计算

计算两个句子之间的语义相似度

属性	详情
任务类型	句子相似度
模型类型	ConGen
标签	sentence-transformers、feature-extraction、sentence-similarity、transformers
许可证	Apache-2.0

精选推荐AI模型

Llama 3 Typhoon V1.5x 8b Instruct

专为泰语设计的80亿参数指令模型，性能媲美GPT-3.5-turbo，优化了应用场景、检索增强生成、受限生成和推理任务

Cadet-Tiny是一个基于SODA数据集训练的超小型对话模型，专为边缘设备推理设计，体积仅为Cosmo-3B模型的2%左右。

Roberta Base Chinese Extractive Qa

基于RoBERTa架构的中文抽取式问答模型，适用于从给定文本中提取答案的任务。

问答系统中文

uer

2,694

智启未来，您的人工智能解决方案智库

简体中文

Congen Paraphrase Multilingual Mpnet Base V2

模型简介

模型特点

模型能力

使用案例

🚀 kornwtp/ConGen-paraphrase-multilingual-mpnet-base-v2

🚀 快速开始

📦 安装指南

💻 使用示例

基础用法

📚 详细文档

📄 许可证

📚 引用与作者