BARThez是基于BART架构的法语序列到序列预训练模型,特别适合生成式任务如抽象摘要。
下载量 1,487
发布时间 : 3/2/2022
模型简介
BARThez是一个专业的法语序列到序列预训练模型,通过重建被破坏的输入句子进行预训练,使用了66GB法语原始文本语料库。与现有的基于BERT的法语模型不同,BARThez特别适合生成式任务,因为其不仅预训练了编码器,还预训练了解码器。
模型特点
生成式任务优化
BARThez不仅预训练了编码器,还预训练了解码器,特别适合生成式任务如抽象摘要。
大规模预训练
使用了66GB法语原始文本语料库进行预训练,覆盖广泛的语言现象。
多版本支持
提供基础版(BARThez)和大型版(mBARThez)两种版本,满足不同需求。
模型能力
文本生成
抽象摘要
填充掩码
使用案例
自然语言处理
法语文本摘要
使用BARThez生成法语文本的抽象摘要。
在生成式任务中表现优异。
填充掩码任务
使用BARThez填充句子中的掩码部分。
能够准确预测缺失的词汇。
精选推荐AI模型
Llama 3 Typhoon V1.5x 8b Instruct
专为泰语设计的80亿参数指令模型,性能媲美GPT-3.5-turbo,优化了应用场景、检索增强生成、受限生成和推理任务
大型语言模型
Transformers

支持多种语言
L
scb10x
3,269
16
Cadet Tiny
Openrail
Cadet-Tiny是一个基于SODA数据集训练的超小型对话模型,专为边缘设备推理设计,体积仅为Cosmo-3B模型的2%左右。
对话系统
Transformers

英语
C
ToddGoldfarb
2,691
6
Roberta Base Chinese Extractive Qa
基于RoBERTa架构的中文抽取式问答模型,适用于从给定文本中提取答案的任务。
问答系统
中文
R
uer
2,694
98
AIbase是一个专注于MCP服务的平台,为AI开发者提供高质量的模型上下文协议服务,助力AI应用开发。
简体中文