B

Barthez

由 moussaKam 开发
BARThez是基于BART架构的法语序列到序列预训练模型,特别适合生成式任务如抽象摘要。
下载量 1,487
发布时间 : 3/2/2022
模型介绍
内容详情
替代品

模型简介

BARThez是一个专业的法语序列到序列预训练模型,通过重建被破坏的输入句子进行预训练,使用了66GB法语原始文本语料库。与现有的基于BERT的法语模型不同,BARThez特别适合生成式任务,因为其不仅预训练了编码器,还预训练了解码器。

模型特点

生成式任务优化
BARThez不仅预训练了编码器,还预训练了解码器,特别适合生成式任务如抽象摘要。
大规模预训练
使用了66GB法语原始文本语料库进行预训练,覆盖广泛的语言现象。
多版本支持
提供基础版(BARThez)和大型版(mBARThez)两种版本,满足不同需求。

模型能力

文本生成
抽象摘要
填充掩码

使用案例

自然语言处理
法语文本摘要
使用BARThez生成法语文本的抽象摘要。
在生成式任务中表现优异。
填充掩码任务
使用BARThez填充句子中的掩码部分。
能够准确预测缺失的词汇。