U

USER Bge M3

由 deepvk 开发
俄语通用句子编码器,基于sentence-transformers框架,专门为俄语文本提取1024维稠密向量
下载量 339.46k
发布时间 : 7/5/2024
模型介绍
内容详情
替代品

模型简介

该模型能将俄语句子和段落映射到1024维稠密向量空间,适用于聚类或语义搜索等任务。基于bge-m3模型架构优化俄语处理能力。

模型特点

俄语优化
专门针对俄语文本进行优化训练,在俄语语义理解任务上表现优异
多数据集训练
融合ru-HNP、ru-WANLI等多个俄语数据集进行训练
高性能向量编码
生成1024维稠密向量,支持高效的相似度计算和聚类分析

模型能力

俄语文本向量化
语义相似度计算
文本聚类分析
特征提取

使用案例

信息检索
俄语语义搜索
构建俄语搜索引擎的语义匹配功能
在encodechka基准测试中平均得分0.799
文本分析
俄语文本聚类
对俄语新闻或社交媒体内容进行主题聚类