V

Vietnamese Embedding

由 AITeamVN 开发
基于BGE-M3微调的越南语嵌入模型,增强越南语检索能力
下载量 14.26k
发布时间 : 3/17/2025
模型介绍
内容详情
替代品

模型简介

Vietnamese_Embedding是基于BGE-M3模型微调的嵌入模型,专门针对越南语检索任务优化,在约30万组越南语查询、正向文档和负向文档三元组上进行训练。

模型特点

越南语优化
专门针对越南语检索任务进行微调,提升越南语文本的嵌入质量
长文本支持
支持最大2048个标记的序列长度,适合处理长文档
高性能
在法律文本检索任务上表现优于基础模型BGE-M3和其他越南语嵌入模型

模型能力

越南语文本嵌入
句子相似度计算
文档检索

使用案例

信息检索
法律文档检索
在法律文本数据集上实现高准确率的文档检索
在Legal Zalo 2021数据集上Accuracy@1达到0.7274
通用文档检索
适用于各种越南语文档的检索任务