R

Rubert Mini Uncased

由 sergeyzh 开发
该模型用于计算俄语和英语句子的嵌入向量,通过蒸馏ai-forever/FRIDA的嵌入向量获得。模型属于uncased类型,不区分文本中的大小写字母。
下载量 724
发布时间 : 3/25/2025
模型介绍
内容详情
替代品

模型简介

该模型用于计算俄语和英语句子的嵌入向量,通过蒸馏FRIDA的嵌入向量获得。嵌入向量大小为384,层数为7,上下文大小为512个标记。模型支持多种前缀功能以提高不同任务的性能。

模型特点

多语言支持
支持俄语和英语句子的嵌入向量计算
前缀功能
继承自FRIDA的多任务前缀功能,可针对不同任务优化性能
微型模型
轻量级设计,嵌入向量大小为384,层数为7,适合资源有限的环境
不区分大小写
uncased类型,不区分文本中的大小写字母

模型能力

计算句子嵌入向量
语义文本相似度计算
复述识别
自然语言推理
情感分析
毒性识别

使用案例

文本相似度
搜索查询匹配
使用search_query前缀优化搜索查询与文档的匹配
在ruMTEB基准测试中NDCG@10得分为0.791
复述识别
使用paraphrase前缀识别语义相似的句子
在复述识别任务中得分为0.760
文本分类
情感分析
使用categorize_sentiment前缀进行情感分类
在情感分析任务中得分为0.798
主题分类
使用categorize_topic前缀进行主题分类
在标题分类任务中准确率达0.884