G

Greennode Embedding Large VN V1

由 GreenNode 开发
这是一个针对越南语优化的句子嵌入模型,能够将文本转换为1024维向量,适用于语义相似度和检索任务。
下载量 785
发布时间 : 4/11/2025
模型介绍
内容详情
替代品

模型简介

基于XLM-RoBERTa架构的句子嵌入模型,专门针对越南语文本进行优化,支持语义相似度计算、文本检索和聚类等任务。

模型特点

越南语优化
专门针对越南语文本训练,在越南语检索任务上表现优于通用多语言模型
长文本支持
支持最大8192个标记的序列长度,适合处理较长文档
高性能检索
在多个越南语检索基准测试中表现优异,特别是在表格检索任务上

模型能力

语义文本相似度计算
语义搜索
文本聚类
文本分类
复述挖掘

使用案例

信息检索
法律文档检索
在法律文本库中快速查找相关文档
在Zac法律文本检索数据集上达到74.95%的平均性能
表格数据检索
从结构化表格数据中检索相关信息
在GreenNode表格检索数据集上达到46.23%的平均性能
问答系统
越南语问答
构建越南语问答系统的检索组件
在VieQuAD数据集上达到56.86%的平均性能