V

Vi Word Segmentation

由 NlpHUST 开发
基于ELECTRA架构的越南语分词模型,在VLSP 2013数据集上微调,提供高精度的越南语分词能力
下载量 1,756
发布时间 : 10/30/2022
模型介绍
内容详情
替代品

模型简介

该模型专门用于越南语文本的分词任务,能够准确识别越南语中的词语边界,适用于自然语言处理中的预处理环节

模型特点

高精度分词
在VLSP 2013评估集上达到98.35%的F1值
基于ELECTRA架构
使用高效的ELECTRA预训练模型作为基础,具有更好的上下文理解能力
专业领域适应
在政府公文和社会经济类文本上表现优异

模型能力

越南语文本分词
专业术语识别
复合词分割

使用案例

政府文档处理
国会文件分析
对越南国会讨论文件进行自动分词处理
可准确分割政府公文中的专业术语和复合词
社会经济研究
社会经济报告处理
自动处理越南社会经济形势报告文本
能正确识别经济领域专业词汇