M

Multiindicwikibiounified

由 ai4bharat 开发
一个基于IndicBART微调的多语言序列到序列模型,支持9种印度语言的传记生成
下载量 54
发布时间 : 3/16/2022

模型简介

该模型在IndicWikiBio数据集上微调,专门用于生成印度语言的维基风格传记文本。支持阿萨姆语、孟加拉语、印地语等多种印度语言。

模型特点

多语言支持
支持9种印度语言,包括一些不被mBART50和mT5支持的语言
高效计算
比mBART和mT5(基础版)更小,计算成本更低
印度语言优化
基于34,653个印度语言示例微调,所有语言以梵文字母表示以促进迁移学习

模型能力

多语言文本生成
传记文本生成
印度语言处理

使用案例

内容生成
维基风格传记生成
根据结构化信息生成维基百科风格的传记文本
在IndicWikiBio测试集上RougeL得分从38.84到67.48不等
AIbase
智启未来,您的人工智能解决方案智库
简体中文