distilbart-mnli-12-6开源模型 - 减小规模同时保持高性能推理能力

首页

Distilbart Mnli 12 6

由 valhalla 开发

DistilBart-MNLI 是 BART-large-MNLI 的蒸馏版本，采用无教师蒸馏技术，在保持高性能的同时显著减小模型规模。

文本分类 #零样本分类 #文本推理 #模型蒸馏

下载量 49.63k

发布时间 : 3/2/2022

模型简介

该模型是用于零样本分类任务的蒸馏版本，基于 BART 架构，专门针对 MNLI（多类型自然语言推理）任务优化。

模型特点

高效蒸馏

采用无教师蒸馏技术，从 bart-large-mnli 中交替复制层，显著减小模型规模

高性能保持

在 MNLI 任务上保持接近原始模型的准确率（匹配准确率 89.19%，不匹配准确率 89.01%）

多规格选择

提供不同层数的蒸馏版本（12-1,12-3,12-6,12-9）以满足不同性能需求

模型能力

零样本分类

自然语言推理

文本分类

使用案例

文本分析

情感分析

无需微调即可对文本进行情感倾向分类

主题分类

对文档内容进行自动分类

语义理解

文本蕴含判断

判断两段文本之间的逻辑关系（蕴含/矛盾/中立）

在 MNLI 数据集上达到 89.19% 准确率

模型	匹配准确率	不匹配准确率
bart-large-mnli (基线模型, 12 - 12)	89.9	90.01
distilbart-mnli-12-1	87.08	87.5
distilbart-mnli-12-3	88.1	88.19
distilbart-mnli-12-6	89.19	89.01
distilbart-mnli-12-9	89.56	89.52

精选推荐AI模型

Llama 3 Typhoon V1.5x 8b Instruct

专为泰语设计的80亿参数指令模型，性能媲美GPT-3.5-turbo，优化了应用场景、检索增强生成、受限生成和推理任务

Cadet-Tiny是一个基于SODA数据集训练的超小型对话模型，专为边缘设备推理设计，体积仅为Cosmo-3B模型的2%左右。

Roberta Base Chinese Extractive Qa

基于RoBERTa架构的中文抽取式问答模型，适用于从给定文本中提取答案的任务。

问答系统中文

uer

2,694

智启未来，您的人工智能解决方案智库

简体中文

Distilbart Mnli 12 6

模型简介

模型特点

模型能力

使用案例

🚀 DistilBart-MNLI

✨ 主要特性

📦 安装指南

📚 详细文档

模型性能对比

训练日志