V

Vietnamese Bi Encoder

由 bkai-foundation-models 开发
这是一个基于PhoBERT-base-v2的句子转换器模型,专为越南语文本的语义相似度任务设计。
下载量 30.46k
发布时间 : 9/9/2023
模型介绍
内容详情
替代品

模型简介

该模型将越南语句子和段落映射到768维的密集向量空间,可用于聚类、语义搜索等自然语言处理任务。

模型特点

优化的越南语处理
基于PhoBERT-base-v2预训练模型,专门针对越南语文本进行了优化
多数据集训练
在MS Macro、SQuAD v2和Zalo法律文本检索挑战赛数据集上进行了训练
高性能语义编码
在Zalo法律文本检索任务上表现出色,Acc@1达到73.28%

模型能力

句子嵌入
语义相似度计算
文本聚类
信息检索

使用案例

法律文本检索
法律文档相似性搜索
在法律文档库中查找语义相似的文档
在Zalo法律文本检索挑战赛上Acc@1达到73.28%
教育应用
教育内容检索
在教育资源库中查找相关的学习材料