A

Albertina 100m Portuguese Ptbr Encoder

由 PORTULAN 开发
Albertina 100M PTBR是一个面向巴西葡萄牙语的基础大语言模型,属于BERT家族的编码器,基于Transformer神经网络架构,并在DeBERTa模型基础上开发。
下载量 131
发布时间 : 5/25/2023
模型介绍
内容详情
替代品

模型简介

该模型是针对巴西葡萄牙语的基础大语言模型,具有1亿参数,采用MIT许可证分发,可用于掩码语言建模等任务。

模型特点

巴西葡萄牙语优化
专门针对巴西葡萄牙语进行训练和优化,提供更准确的语言理解能力。
基于DeBERTa架构
在DeBERTa模型基础上开发,结合了Transformer架构的优势,具有更强的性能表现。
开源许可证
采用MIT许可证分发,允许自由使用和修改。

模型能力

掩码语言建模
文本理解
下游任务微调

使用案例

自然语言处理
语义相似度分析
可用于分析两段文本的语义相似度
在STS-B任务上达到0.8501皮尔逊系数
文本蕴含识别
判断一段文本是否蕴含另一段文本的含义
在RTE任务上达到0.6462准确率
文本处理
自动补全
预测被掩码遮盖的词语
示例中准确预测了'costumes'作为最佳补全词