B

BGE M3 Ko

由 dragonkue 开发
基于BAAI/bge-m3优化的韩英语双语句子嵌入模型,支持语义文本相似度、信息检索等任务
下载量 29.78k
发布时间 : 9/17/2024
模型介绍
内容详情
替代品

模型简介

这是一个基于sentence-transformers框架训练的模型,专门针对韩语和英语进行了优化。它将句子和段落映射到1024维稠密向量空间,可用于语义文本相似度、语义搜索、复述挖掘、文本分类、聚类等任务。

模型特点

韩语优化
在标准BGE-M3基础上针对韩语进行了专门训练和优化
长文本支持
支持最大8192个标记的序列长度,适合处理较长文本
高性能检索
在韩语嵌入基准测试中表现出色,Top-1 F1得分达0.7456
多相似度计算
支持余弦相似度和点积相似度两种计算方式

模型能力

语义文本相似度计算
信息检索
文本特征提取
文本分类
文本聚类
复述挖掘

使用案例

信息检索
韩语文档检索
根据查询语句从韩语文档库中检索最相关的文档
在Top-1检索中达到0.7456的F1分数
文本相似度
相似问题匹配
识别不同表述但语义相似的问题