A

All Datasets V3 MiniLM L12

由 flax-sentence-embeddings 开发
基于MiniLM-L12架构的句子嵌入模型,通过对比学习在超10亿句对数据集上训练,可生成高质量的语义向量表示
下载量 887
发布时间 : 3/2/2022

模型简介

该模型是专为句子级语义理解设计的编码器,可将输入文本转换为384维向量表示,适用于信息检索、文本相似度计算等场景

模型特点

大规模对比学习训练
在包含10亿句对的多样化数据集上进行对比学习训练,增强模型语义理解能力
高效轻量架构
基于MiniLM-L12的轻量级Transformer架构,在保持性能的同时降低计算资源需求
多源数据融合
整合来自23个不同领域的数据源,使模型具备广泛的语义覆盖能力

模型能力

文本向量化
语义相似度计算
信息检索增强
文本聚类分析

使用案例

信息检索
搜索引擎结果优化
通过语义匹配提升搜索结果相关性
可识别查询意图,返回更符合用户需求的文档
智能客服
问题相似度匹配
识别用户问题与知识库问题的语义相似度
提高自动问答系统的准确率
AIbase
智启未来,您的人工智能解决方案智库
简体中文