I

Indictrans2 Indic En 1B

由 ai4bharat 开发
支持25种印度语言与英语互译的1.1B参数规模机器翻译模型,由AI4Bharat项目开发
下载量 473.63k
发布时间 : 9/9/2023
模型介绍
内容详情
替代品

模型简介

基于Transformer架构的大规模多语言神经机器翻译模型,专注于印度22种计划语言与英语之间的高质量互译,支持多种文字系统转换

模型特点

多文字系统支持
支持同一语言的多种文字系统转换(如克什米尔语阿拉伯文/天城文)
大规模语言覆盖
覆盖印度22种计划语言及英语,共25种语言变体
长文本处理能力
RoPE变体支持2048标记的序列长度(需使用特定版本)
实体保留机制
通过后处理流程保留专有名词等实体信息

模型能力

印度语言互译
英语-印度语言双向翻译
多文字系统转换
长文本翻译

使用案例

跨语言交流
政府文件翻译
将政府公告在多语言间转换
保持官方术语一致性
内容本地化
教育材料翻译
将教材翻译为各地区语言版本