D

Dist Mpnet Czeng Cs En

由 Seznam 开发
这是一个从all-mpnet-base-v2模型蒸馏得到的捷克语-英语双语BERT-small模型,由Seznam.cz开发,专注于语义嵌入任务。
下载量 1,232
发布时间 : 11/2/2023
模型介绍
内容详情
替代品

模型简介

该模型是通过知识蒸馏技术从大型MPNet模型压缩得到的小型语义嵌入模型,支持捷克语和英语,适用于多种自然语言处理任务。

模型特点

双语支持
同时支持捷克语和英语的语义嵌入计算
高效蒸馏
通过知识蒸馏技术保留大模型性能的同时显著减小模型尺寸
高质量嵌入
在多种语义任务中表现优异,包括相似性搜索和文本分类

模型能力

计算句子相似度
生成语义嵌入向量
支持跨语言语义匹配

使用案例

信息检索
跨语言文档检索
使用该模型可以构建支持捷克语和英语的跨语言文档检索系统
能够有效匹配不同语言但语义相似的文档
文本分析
文本聚类
利用模型生成的嵌入向量对捷克语和英语文本进行聚类分析
能够发现跨语言的相似主题内容