X

Xtremedistil L12 H384 Uncased

由 microsoft 开发
XtremeDistilTransformers是一种经过蒸馏的任务无关Transformer模型,通过任务迁移学习小型通用模型,可应用于任意任务和语言。
下载量 471
发布时间 : 3/2/2022
模型介绍
内容详情
替代品

模型简介

该模型结合了多任务蒸馏技术,通过任务迁移学习实现小型通用模型,适用于多种自然语言处理任务和多语言场景。

模型特点

高效蒸馏
通过多阶段蒸馏技术从大型模型中提取知识,保持性能的同时大幅减小模型规模。
任务无关
设计为任务无关模型,可灵活应用于各种自然语言处理任务。
多语言支持
模型设计支持多语言应用场景。
高效推理
相比BERT-base提速5.3倍,同时保持较高的性能表现。

模型能力

文本分类
自然语言理解
问答系统

使用案例

自然语言处理
文本分类
可用于各种文本分类任务,如情感分析、主题分类等。
在GLUE基准测试中表现优异
问答系统
适用于构建问答系统,能够理解问题并提供准确回答。
在SQuAD-v2数据集上取得76.6的F1分数