I

Ibert Roberta Base

由 kssteven 开发
I-BERT是RoBERTa的纯整数量化版本,采用INT8格式存储参数并使用整数运算进行推理,显著提升推理速度。
下载量 2,988
发布时间 : 3/2/2022
模型介绍
内容详情
替代品

模型简介

I-BERT将Transformer架构中的浮点运算替换为整数运算,实现高效推理。适用于需要快速文本处理的任务。

模型特点

纯整数运算
所有参数以INT8格式存储,完全使用整数运算进行推理,无需浮点运算。
高效推理
在Nvidia T4 GPU上测试时,相比浮点版本可实现最高4倍的推理加速。
量化感知训练
支持量化感知微调,通过三阶段流程优化量化模型性能。

模型能力

文本分类
自然语言理解
高效推理

使用案例

文本处理
文本分类
如MRPC等文本分类任务
通过量化感知训练保持较高准确率