V

Varta T5

由 rahular 开发
Varta-T5是基于Varta数据集预训练的多语言模型,支持14种印度语言和英语,主要用于文本生成和分类任务。
下载量 751
发布时间 : 1/12/2023
模型介绍
内容详情
替代品

模型简介

基于T5架构的多语言文本生成模型,设计用于下游任务的微调,涵盖14种印度语言及英语。

模型特点

多语言支持
覆盖14种印度语言及英语,特别关注低资源语言
双预训练目标
结合跨度损坏与间隔句生成,提升模型理解能力
大规模数据
基于4180万篇新闻文章训练,是同类最大规模印度语言数据集

模型能力

文本生成
机器翻译
文档摘要
问答系统
情感分析

使用案例

新闻领域
新闻标题生成
根据新闻正文自动生成标题
多语言新闻摘要
生成印度多种语言的新闻摘要
跨语言应用
印度语言机器翻译
在印度语言之间进行翻译