R

Rubert Tiny

由 cointegrated 开发
针对俄语和英语的bert-base-multilingual-cased模型的极小型蒸馏版本(45MB,1200万参数),注重速度与体积而非绝对准确率
下载量 36.18k
发布时间 : 3/2/2022
模型介绍
内容详情
替代品

模型简介

这是一个经过蒸馏的微型BERT模型,适用于俄语和英语任务。模型体积小、速度快,适合简单俄语任务如命名实体识别或情感分类。其CLS嵌入向量可作为俄英双语对齐的句子表征使用。

模型特点

微型化设计
体积与速度约为标准BERT模型的十分之一,仅45MB大小
双语支持
同时支持俄语和英语处理,嵌入向量可实现双语对齐
多任务适用
适用于多种下游任务,包括分类、命名实体识别等
高效蒸馏
通过MLM损失、翻译排序损失和嵌入向量蒸馏技术训练

模型能力

填充掩码
特征提取
句子相似度计算
文本分类
命名实体识别

使用案例

自然语言处理
俄语文本分类
对俄语文本进行情感分析或主题分类
双语句子对齐
利用CLS嵌入向量实现俄英双语句子相似度计算
命名实体识别
识别俄语文本中的人名、地名等实体