Minilmv2 L6 H384 Distilled From BERT Base

由 nreimers 开发

MiniLMv2 是微软推出的轻量级预训练语言模型，通过知识蒸馏技术实现高效推理。

大型语言模型

Transformers

#轻量级BERT #知识蒸馏 #多语言NLP

下载量 179

发布时间 : 3/2/2022

模型介绍

内容详情

替代品

模型简介

MiniLMv2 是一种基于 Transformer 架构的轻量级预训练语言模型，通过知识蒸馏技术从大型模型中提取知识，在保持较高性能的同时显著减小模型规模，适用于资源受限的环境。

模型特点

轻量高效

通过知识蒸馏技术大幅减小模型规模，适合资源受限环境部署。

高性能

在多项 NLP 任务上接近或达到大型模型的性能水平。

通用性强

适用于多种自然语言处理任务，无需针对特定任务进行大幅调整。

模型能力

文本分类

问答系统

文本生成

语义相似度计算

信息抽取

使用案例

智能客服

自动问答

用于构建轻量级客服问答系统

高效准确地回答常见问题

移动应用

移动端文本处理

在手机等移动设备上实现本地化文本分析

低延迟、保护用户隐私

精选推荐AI模型

Llama 3 Typhoon V1.5x 8b Instruct

专为泰语设计的80亿参数指令模型，性能媲美GPT-3.5-turbo，优化了应用场景、检索增强生成、受限生成和推理任务

Cadet-Tiny是一个基于SODA数据集训练的超小型对话模型，专为边缘设备推理设计，体积仅为Cosmo-3B模型的2%左右。

Roberta Base Chinese Extractive Qa

基于RoBERTa架构的中文抽取式问答模型，适用于从给定文本中提取答案的任务。

AIbase是一个专注于MCP服务的平台，为AI开发者提供高质量的模型上下文协议服务，助力AI应用开发。

简体中文

热门模型

Llama 3 Typhoon V1.5x 8b Instruct

Cadet Tiny

Roberta Base Chinese Extractive Qa

热门模型分类

热门标签