X

Xlmindic Base Uniscript Soham

由 ibraheemmoosa 开发
这是一个基于ALBERT架构的多语言模型,专门针对印度-雅利安语系语言进行优化,支持ISO-15919转写文本处理。
下载量 117
发布时间 : 3/2/2022
模型介绍
内容详情
替代品

模型简介

该模型经过微调,主要用于处理转写为ISO-15919格式的印度语言文本,支持多种自然语言处理任务。

模型特点

ISO-15919转写支持
模型接受ISO-15919转写文本,使不同书写系统的印度语言能够统一处理。
多语言能力
支持14种印度-雅利安语系语言的处理,具有跨语言表示学习能力。
高效架构
基于ALBERT架构,参数共享机制使得模型更轻量高效。
IndicGLUE基准表现优异
在多个印度语言处理任务上超越了mBERT、XLM-R等基准模型。

模型能力

文本分类
命名实体识别
掩码语言建模
跨语言文本处理
印度语言理解

使用案例

新闻分类
孟加拉新闻分类
对孟加拉语新闻文章进行体裁分类
在Soham数据集上达到93.89%准确率
印地语新闻分类
对BBC印地语新闻文章进行分类
达到79.14%准确率
语言理解
跨语言文本处理
处理转写为ISO-15919格式的多种印度语言文本
在IndicGLUE基准测试中表现优异