C

Congen TinyBERT L4

由 kornwtp 开发
基于ConGen的句子嵌入模型,能将句子映射到312维向量空间,适用于语义搜索等任务。
下载量 13
发布时间 : 10/10/2022
模型介绍
内容详情
替代品

模型简介

该模型基于TinyBERT-L4架构,通过无监督控制与泛化蒸馏方法训练,专注于生成高质量的句子嵌入表示。

模型特点

无监督学习
采用无监督控制与泛化蒸馏方法训练,无需标注数据即可学习句子表示。
高效向量化
将句子映射到312维密集向量空间,便于后续相似度计算和语义搜索。
轻量级架构
基于TinyBERT-L4架构,在保持性能的同时减少模型复杂度。

模型能力

句子嵌入生成
语义相似度计算
文本特征提取

使用案例

信息检索
语义搜索
通过句子向量相似度实现更精准的语义搜索
文本分析
文档聚类
基于句子嵌入对文档进行自动分类和聚类