S

Sbert Uncased Finnish Paraphrase

由 TurkuNLP 开发
基于FinBERT训练的芬兰语句子BERT模型,用于句子相似度计算和特征提取
下载量 895
发布时间 : 3/2/2022
模型介绍
内容详情
替代品

模型简介

这是一个基于FinBERT训练的句子转换器模型,专门用于芬兰语的句子相似度计算和特征提取。模型通过均值池化处理句子嵌入,适用于释义识别等任务。

模型特点

无大小写区分
模型对大小写不敏感,适合处理不同大小写形式的芬兰语文本
高质量芬兰语训练
基于芬兰语释义语料库和自动收集的释义候选句训练(50万正例,500万负例)
高效句子嵌入
使用均值池化方法生成高质量的句子级嵌入表示

模型能力

句子特征提取
句子相似度计算
语义相似度比较
芬兰语文本处理

使用案例

文本相似度
释义识别
识别两个芬兰语句子是否为释义关系
在芬兰语释义语料库上表现良好
语义搜索
从大规模文本中检索语义相似的句子
可用于构建400万句子的语义检索系统
特征提取
句子嵌入生成
为下游任务生成句子级别的特征表示
生成768维的句子嵌入向量