X

Xtremedistil L6 H384 Uncased

由 microsoft 开发
XtremeDistilTransformers是一种经过知识蒸馏的轻量级Transformer模型,具有任务无关性,可应用于多种自然语言处理任务。
下载量 1,854
发布时间 : 3/2/2022
模型介绍
内容详情
替代品

模型简介

该模型通过任务迁移技术进行知识蒸馏,学习小型通用模型,适用于任意任务与语言。相比BERT-base,实现了5.3倍的加速。

模型特点

任务无关蒸馏
通过任务迁移技术学习小型通用模型,可应用于任意任务与语言。
高效性能
相比BERT-base实现5.3倍加速,同时保持较高的性能表现。
多任务蒸馏技术
融合了XtremeDistil和MiniLM等多任务蒸馏技术,优化模型性能。

模型能力

文本分类
问答系统
自然语言理解

使用案例

自然语言处理
文本分类
可用于情感分析、主题分类等文本分类任务。
在GLUE开发集的MNLI任务上达到85.4%的准确率。
问答系统
适用于构建高效的问答系统。
在SQuAD-v2任务上达到76.6%的F1分数。