P

Pino Bigbird Roberta Base

由 flax-community 开发
Pino是基于BigBird架构的荷兰语预训练模型,采用稀疏注意力机制处理长序列文本,支持最长4096的序列长度。
下载量 17
发布时间 : 3/2/2022
模型介绍
内容详情
替代品

模型简介

BigBird是一种基于稀疏注意力的Transformer模型,能够高效处理长序列文本。该模型针对荷兰语进行了预训练,适用于需要处理长文本的任务。

模型特点

长序列处理能力
采用块稀疏注意力机制,可高效处理长达4096的序列,计算成本显著低于传统Transformer
荷兰语优化
专门针对荷兰语进行预训练,使用mC4和荷兰新闻数据集
灵活注意力配置
支持完全注意力模式和块稀疏模式,可调整block_size和num_random_blocks参数

模型能力

长文本理解
荷兰语文本处理
掩码语言建模

使用案例

自然语言处理
长文档摘要
处理和分析长文档并生成摘要
长上下文问答
基于长文档内容回答复杂问题