M

Minilm L6 H384 Uncased

由 nreimers 开发
这是microsoft/MiniLM-L12-H384-uncased的6层精简版本,通过每隔一层保留结构实现轻量化
下载量 9,300
发布时间 : 3/2/2022
模型介绍
内容详情
替代品

模型简介

基于原始12层MiniLM模型的轻量化版本,保留了核心功能但减少了层数,适用于需要高效推理的场景

模型特点

轻量化设计
通过减少层数(从12层减至6层)实现模型压缩,适合资源受限环境
保留核心能力
采用间隔保留层的策略,最大限度保持原始模型的语义理解能力
高效推理
层数减少带来更快的推理速度和更低的内存占用

模型能力

文本嵌入
语义理解
句子相似度计算

使用案例

语义检索
文档相似度匹配
快速计算文档/句子间的语义相似度
高效实现大规模文档检索
轻量级NLP应用
移动端NLP
在资源受限设备上部署语义理解功能
降低硬件需求同时保持可用精度