D

Dist Mpnet Paracrawl Cs En

由 Seznam 开发
基于BERT-small架构的蒸馏模型,专为捷克语-英语语义嵌入设计
下载量 393
发布时间 : 11/2/2023
模型介绍
内容详情
替代品

模型简介

该模型是基于BERT-small架构的蒸馏模型,主要用于生成高质量的语义嵌入向量,适用于相似性搜索、信息检索、文本聚类和分类等任务。

模型特点

多语言支持
支持捷克语和英语的双语语义嵌入
蒸馏技术
基于蒸馏技术从all-mpnet-base-v2模型迁移知识,保持高性能的同时减小模型规模
高质量嵌入
生成高质量的语义嵌入向量,适用于多种下游任务

模型能力

语义相似度计算
文本嵌入生成
跨语言检索
文本聚类
文本分类

使用案例

信息检索
跨语言文档检索
使用模型生成的嵌入向量进行捷克语和英语文档的相似性检索
提高跨语言检索的准确性和效率
文本分析
文本聚类
对捷克语或英语文本进行自动聚类分析
发现文本数据中的潜在主题和模式