MiniLM-L12-H384-uncased开源语言模型 - 免费部署助力语言理解与生成

首页

Minilm L12 H384 Uncased

由 microsoft 开发

MiniLM是一种小型高效的预训练语言模型，通过深度自注意力蒸馏技术压缩而成，适用于语言理解与生成任务。

大型语言模型开源协议:MIT #高效蒸馏模型 #轻量级Transformer #多任务微调

下载量 10.19k

发布时间 : 3/2/2022

模型简介

MiniLM是基于Transformer架构的小型预训练模型，通过任务无关的压缩和深度自注意力蒸馏技术提炼而成，可直接替代BERT模型使用，但需要先进行微调。

模型特点

高效压缩

通过深度自注意力蒸馏技术实现模型压缩，参数规模仅为3300万，比BERT-Base小得多。

高性能

在多项NLP任务上表现优异，如SQuAD 2.0和GLUE基准测试，性能接近或超过BERT-Base。

快速推理

推理速度较BERT-Base提升2.7倍，适合需要高效部署的场景。

模型能力

自然语言理解

文本分类

问答系统

使用案例

文本分析

情感分析

对文本进行情感倾向分类

在SST-2数据集上达到93.0%准确率

自然语言推理

判断两段文本之间的逻辑关系

在MNLI数据集上达到85.7%准确率

问答系统

开放域问答

回答基于文本内容的问题

在SQuAD 2.0数据集上达到81.7%准确率

模型	参数数量	SQuAD 2.0	MNLI-m	SST-2	QNLI	CoLA	RTE	MRPC	QQP
BERT-Base	1.09亿	76.8	84.5	93.2	91.7	58.9	68.6	87.3	91.3
MiniLM-L12xH384	3300万	81.7	85.7	93.0	91.5	58.5	73.3	89.5	91.3

精选推荐AI模型

Llama 3 Typhoon V1.5x 8b Instruct

专为泰语设计的80亿参数指令模型，性能媲美GPT-3.5-turbo，优化了应用场景、检索增强生成、受限生成和推理任务

Cadet-Tiny是一个基于SODA数据集训练的超小型对话模型，专为边缘设备推理设计，体积仅为Cosmo-3B模型的2%左右。

Roberta Base Chinese Extractive Qa

基于RoBERTa架构的中文抽取式问答模型，适用于从给定文本中提取答案的任务。

问答系统中文

uer

2,694

智启未来，您的人工智能解决方案智库

简体中文

Minilm L12 H384 Uncased

模型简介

模型特点

模型能力

使用案例

🚀 MiniLM：用于语言理解与生成的小型快速预训练模型

🚀 快速开始

✨ 主要特性

英文预训练模型

在NLU任务上的微调

📄 许可证

📚 引用