M

Msmarco Distilbert Base Tas B Mmarco Pt 300k

由 mpjan 开发
这是一个基于DistilBERT架构的葡萄牙语句子嵌入模型,专门针对语义相似度任务进行了优化。
下载量 37
发布时间 : 11/5/2022
模型介绍
内容详情
替代品

模型简介

该模型能将葡萄牙语句子和段落映射到768维向量空间,适用于聚类、语义搜索等自然语言处理任务。

模型特点

葡萄牙语优化
专门针对葡萄牙语文本进行了微调,在葡萄牙语语义理解任务上表现更优
高效架构
基于DistilBERT架构,在保持性能的同时比标准BERT模型更轻量
语义向量表示
能将文本转换为768维稠密向量,捕捉深层语义信息

模型能力

文本向量化
语义相似度计算
文本聚类
语义搜索

使用案例

信息检索
葡萄牙语文档搜索
构建基于语义的葡萄牙语搜索引擎
相比关键词搜索能获得更相关的结果
文本分析
葡萄牙语文本聚类
对葡萄牙语客户反馈或评论进行自动分类
无需人工标注即可发现文本主题模式