M

Muril Large Cased

由 google 开发
基于BERT大型架构的多语言印度语言预训练模型,涵盖17种印度语言及其转写版本
下载量 6,307
发布时间 : 3/2/2022
模型介绍
内容详情
替代品

模型简介

MuRIL是针对印度语言优化的多语言表征模型,通过整合翻译和转写数据提升低资源语言性能,适用于印度语言的NLP任务

模型特点

多语言转写优化
同时训练原始文本与转写文本对,专门处理印度常见的语言转写现象
低资源语言增强
采用0.3指数上采样策略,显著提升低资源语言的模型性能
平行数据训练
整合翻译数据(Google NMT)和转写数据(IndicTrans)进行联合训练

模型能力

多语言文本理解
跨语言转写处理
命名实体识别
文本分类
问答系统

使用案例

政府服务
多语言政策文件分析
处理印度不同语言版本的政府文件
PANX任务F1值达77.7%
教育
跨语言教育资源处理
自动处理不同印度语言版本的教育材料
TyDiQA任务F1值提升3%