N

Nb Sbert Base

由 NbAiLab 开发
NB-SBERT-基础版是基于SentenceTransformers的挪威语句子嵌入模型,用于将句子和段落映射到768维向量空间,支持句子相似度计算等任务。
下载量 3,675
发布时间 : 11/8/2022
模型介绍
内容详情
替代品

模型简介

该模型从nb-bert-base开始,在机器翻译的MNLI数据集版本上训练而成,主要用于句子相似度计算、语义搜索和聚类等任务。

模型特点

跨语言句子相似度
模型训练方式使得不同语言中的相似句子也能彼此接近,支持跨语言句子相似度计算。
高维向量空间
将句子和段落映射到768维的密集向量空间,适用于聚类和语义搜索等任务。
易于集成
支持通过sentence-transformers库或HuggingFace Transformers直接使用,提供多种使用示例。

模型能力

句子嵌入生成
句子相似度计算
语义搜索
文本聚类
关键词提取
主题建模

使用案例

信息检索
语义搜索
使用模型生成的嵌入向量进行语义搜索,找到与查询语义相似的文档或段落。
提高搜索结果的准确性和相关性
文本分析
关键词提取
利用模型提取文档中的关键词,通过比较词与文档的相似度来识别重要词汇。
示例提取的关键词如('国家图书馆', 0.5242)
主题建模
结合BERTopic等技术对文档集合进行主题分析,发现潜在主题结构。
生成易于解释的主题集群
跨语言应用
跨语言句子匹配
识别不同语言中表达相同含义的句子,支持多语言内容对齐。
理想情况下,英语-挪威语句子对应有较高的相似度