M

Multi Sentence BERTino

由 nickprock 开发
这是一个基于BERTino的句子转换器模型,能够将意大利语句子和段落映射到768维的密集向量空间,适用于聚类或语义搜索等任务。
下载量 63.88k
发布时间 : 1/10/2024
模型介绍
内容详情
替代品

模型简介

该模型基于indigo-ai/BERTino训练,使用了意大利语的mmarco和stsb数据集,主要用于句子相似度计算和特征提取。

模型特点

意大利语支持
专门针对意大利语优化,能够有效处理意大利语句子和段落的语义表示。
高效向量化
将文本转换为768维的密集向量,便于后续的相似度计算和聚类分析。
多数据集训练
使用mmarco(20万条)和stsb两个意大利语数据集进行训练,提高了模型的泛化能力。

模型能力

句子相似度计算
文本特征提取
语义搜索
文本聚类

使用案例

信息检索
语义搜索
在意大利语文档集合中查找语义相似的句子或段落。
提高搜索结果的准确性和相关性
文本分析
文本聚类
将意大利语文本按语义相似度进行自动分组。
实现无监督的文本分类