S

Serengeti

由 UBC-NLP 开发
覆盖517种非洲语言的大规模多语言预训练模型
下载量 25
发布时间 : 1/7/2023
模型介绍
内容详情
替代品

模型简介

塞伦盖蒂是一个专注于非洲语言的多语言预训练模型系列,旨在解决非洲语言技术支持的不足问题。它支持517种非洲语言及其变体,在多项自然语言理解任务上表现优异。

模型特点

广泛的非洲语言支持
覆盖517种非洲语言及其变体,是目前支持非洲语言最多的模型之一
多任务优异表现
在8个自然语言理解任务的11个数据集上表现优异,平均F1分数达82.27
非洲中心主义设计
专门针对非洲语言需求开发,考虑非洲人民的使用场景和语言特点

模型能力

掩码语言预测
多语言文本理解
非洲语言处理

使用案例

语言技术
非洲语言信息获取
帮助非其他语言熟练者通过本土语言获取重要信息
促进全球互联
濒危语言保护
为众多濒危非洲语言提供保存契机
激发这些语言在多领域的持续使用
学术研究
语言学研究
助力人类学家、语言学家等非洲语言研究者