M

Melayubert

由 StevenLimcorn 开发
基于BERT架构的马来语掩码语言模型,使用OSCAR数据集的马来语子集训练,支持PyTorch和TensorFlow框架。
下载量 15
发布时间 : 3/2/2022
模型介绍
内容详情
替代品

模型简介

该模型是一个专门针对马来语的掩码语言模型,基于BERT架构开发,主要用于处理马来语文本的掩码预测任务。

模型特点

基于BERT架构
采用经典的BERT架构,确保模型在处理马来语文本时具有强大的性能。
使用OSCAR数据集训练
模型使用OSCAR数据集的马来语子集进行训练,确保了数据的多样性和广泛性。
支持PyTorch和TensorFlow
模型兼容两大主流深度学习框架,方便用户在不同环境中使用。

模型能力

掩码语言预测
马来语文本处理

使用案例

自然语言处理
马来语文本补全
用于预测和补全马来语文本中的掩码部分。
在验证集上达到9.46的困惑度指标。