S

Sentence Bert Base Ja Mean Tokens

由 sonoisa 开发
这是一个基于BERT架构的日语专用句子嵌入模型,用于生成句子的语义向量表示并计算句子相似度。
下载量 51.01k
发布时间 : 3/2/2022
模型介绍
内容详情
替代品

模型简介

该模型是日语版的Sentence-BERT,专门为处理日语句子设计。它能够将日语句子转换为高维向量表示,便于计算句子之间的语义相似度。

模型特点

日语专用
专门针对日语句子优化的BERT模型,能更好地处理日语语法和语义特征
平均池化
采用平均池化方法生成句子嵌入向量,有效捕捉句子整体语义
改进版本
提供精度提升约1.5个百分点的版本2模型

模型能力

日语句子嵌入
句子相似度计算
语义特征提取

使用案例

信息检索
相似问题查找
在FAQ系统中查找与用户提问语义相似的问题
提高问答系统的准确性和效率
文本聚类
文档分类
基于句子语义相似度对文档进行自动分类
减少人工分类的工作量