muril-adapted-local开源模型 - 支持17种印度语言多语言表示的免费工具

首页

Muril Adapted Local

由 monsoon-nlp 开发

MuRIL是谷歌开源的基于17种印度语言及其转写版本预训练的BERT模型，支持多语言表示。

大型语言模型支持多种语言开源协议:Apache-2.0 #印度多语言处理 #全词掩码预训练 #17种语言支持

下载量 24

发布时间 : 3/2/2022

模型简介

该模型通过自监督的掩码语言建模任务进行训练，采用全词掩码策略，最多预测80个词。适用于处理多种印度语言的文本任务。

模型特点

多语言支持

支持17种印度语言及其转写版本，覆盖广泛的语言需求。

全词掩码策略

采用全词掩码策略进行训练，最多预测80个词，提升模型理解能力。

高兼容性

转换为PyTorch格式，确保与HuggingFace Transformers库兼容。

模型能力

文本理解

多语言文本处理

掩码语言建模

使用案例

自然语言处理

多语言文本分类

对印度多种语言的文本进行分类任务。

语言翻译辅助

作为翻译模型的预训练基础，提升翻译质量。

属性	详情
模型类型	BERT预训练模型
训练任务	自监督掩码语言建模
掩码策略	全词掩码，最多80次预测
训练步数	1000K步
批次大小	4096
最大序列长度	512

精选推荐AI模型

Llama 3 Typhoon V1.5x 8b Instruct

专为泰语设计的80亿参数指令模型，性能媲美GPT-3.5-turbo，优化了应用场景、检索增强生成、受限生成和推理任务

Cadet-Tiny是一个基于SODA数据集训练的超小型对话模型，专为边缘设备推理设计，体积仅为Cosmo-3B模型的2%左右。

Roberta Base Chinese Extractive Qa

基于RoBERTa架构的中文抽取式问答模型，适用于从给定文本中提取答案的任务。

问答系统中文

uer

2,694

智启未来，您的人工智能解决方案智库

简体中文

Muril Adapted Local

模型简介

模型特点

模型能力

使用案例

🚀 MuRIL - 非官方版本

🚀 快速开始

✨ 主要特性

📚 详细文档

📄 许可证

🔧 技术细节