G

Greennode Embedding Large VN Mixed V1

由 GreenNode 开发
这是一个基于sentence-transformers的越南语嵌入模型,支持英语和越南语,可将文本映射到1024维向量空间,用于语义相似度计算和检索任务。
下载量 400
发布时间 : 4/11/2025
模型介绍
内容详情
替代品

模型简介

该模型专门针对越南语优化,同时支持英语,适用于语义文本相似性、语义搜索、文本分类和聚类等任务。

模型特点

多语言支持
同时支持越南语和英语的文本嵌入
长文本处理
支持最大8192个标记的长文本序列
高性能检索
在越南语文本检索任务上表现优于同类模型
大向量空间
输出1024维的密集向量表示

模型能力

语义文本相似度计算
语义搜索
文本分类
文本聚类
特征提取

使用案例

信息检索
法律文档检索
在法律文档库中检索相关法律条文
在ZacLegalTextRetrieval数据集上达到74.95%的平均性能
表格数据检索
从结构化表格中检索相关信息
在GreenNodeTableRetrieval数据集上达到44.89%的平均性能
问答系统
越南语问答
构建越南语问答系统的检索模块
在VieQuADRetrieval数据集上达到56.86%的平均性能