Distilbart-mnli-12-1开源模型 - 精简高效，小体积也有高准确率

首页

Distilbart Mnli 12 1

由 valhalla 开发

DistilBart-MNLI 是通过无教师蒸馏技术从 bart-large-mnli 蒸馏得到的精简版本，保持了较高的准确率同时模型更小。

文本分类 #零样本分类 #无教师蒸馏 #文本推理

下载量 217.48k

发布时间 : 3/2/2022

模型简介

该模型是基于 BART 架构的自然语言推理模型，专门用于零样本分类任务。

模型特点

高效蒸馏

采用无教师蒸馏技术，从 bart-large-mnli 中交替复制层结构，大幅减小模型体积

性能保留

尽管模型更小，但在 MNLI 数据集上保持了接近原始模型的准确率

多层配置可选

提供多种层数配置(12-1,12-3,12-6,12-9)，可根据需求平衡性能与效率

模型能力

自然语言推理

零样本分类

文本分类

使用案例

文本分类

零样本情感分析

无需特定训练即可对文本进行情感分类

主题分类

对文档进行主题分类

自然语言理解

文本蕴含判断

判断两段文本之间的逻辑关系(蕴含/中立/矛盾)

在MNLI数据集上准确率达89%左右

模型	匹配准确率	不匹配准确率
bart-large-mnli (基线模型, 12 - 12)	89.9	90.01
distilbart-mnli-12-1	87.08	87.5
distilbart-mnli-12-3	88.1	88.19
distilbart-mnli-12-6	89.19	89.01
distilbart-mnli-12-9	89.56	89.52

精选推荐AI模型

Llama 3 Typhoon V1.5x 8b Instruct

专为泰语设计的80亿参数指令模型，性能媲美GPT-3.5-turbo，优化了应用场景、检索增强生成、受限生成和推理任务

Cadet-Tiny是一个基于SODA数据集训练的超小型对话模型，专为边缘设备推理设计，体积仅为Cosmo-3B模型的2%左右。

Roberta Base Chinese Extractive Qa

基于RoBERTa架构的中文抽取式问答模型，适用于从给定文本中提取答案的任务。

问答系统中文

uer

2,694

智启未来，您的人工智能解决方案智库

简体中文

Distilbart Mnli 12 1

模型简介

模型特点

模型能力

使用案例

🚀 DistilBart-MNLI

✨ 主要特性

📦 安装指南

克隆并从源代码安装transformers

下载MNLI数据

创建学生模型

开始微调

📚 详细文档

模型性能对比

性能权衡详情

训练日志