T

Tavbert He

由 tau 开发
一个基于字符操作的希伯来语BERT风格掩码语言模型,通过掩码字符片段进行预训练,类似于SpanBERT。
下载量 116
发布时间 : 3/2/2022
模型介绍
内容详情
替代品

模型简介

TavBERT是一个专门针对希伯来语的BERT风格语言模型,采用字符级别的掩码策略进行预训练,适用于希伯来语文本处理任务。

模型特点

字符级掩码训练
采用字符片段级别的掩码策略进行预训练,类似于SpanBERT方法,适合希伯来语特性。
希伯来语优化
专门针对希伯来语设计和训练,能更好地处理希伯来语文本特征。
基于RoBERTa架构
采用RoBERTa架构改进,继承了其优秀的语言建模能力。

模型能力

希伯来语文本理解
掩码语言建模
字符级文本预测

使用案例

自然语言处理
希伯来语文本补全
预测被掩码的希伯来语字符片段
能够准确预测被掩码的希伯来语字符片段
希伯来语文本理解
用于下游NLP任务的预训练模型
可作为希伯来语NLP任务的基础模型