K

Kobigbird Bert Base

由 monologg 开发
基于稀疏注意力的韩语Transformer模型,能处理最长4096的序列
下载量 13.19k
发布时间 : 3/2/2022
模型介绍
内容详情
替代品

模型简介

BigBird是一种基于稀疏注意力的Transformer模型,扩展了BERT等模型的长序列处理能力,特别适用于韩语文本处理。

模型特点

长序列处理能力
能处理最长4096的序列,远超传统BERT模型
高效注意力机制
采用块稀疏注意力机制替代常规注意力,显著降低计算成本
韩语优化
基于韩语BERT检查点进行热启动训练,针对韩语特性优化
灵活配置
支持全注意力模式和多种稀疏配置参数调整

模型能力

长文本处理
韩语文本理解
序列建模

使用案例

自然语言处理
长文档分析
处理长篇幅韩语文档,如法律文书、学术论文等
能有效捕捉长距离依赖关系
韩语文本分类
对韩语文本进行分类任务