L

Lsg Camembert Base 4096

由 ccdv 开发
基于CamemBERT-base调整的长序列处理模型,采用局部+稀疏+全局注意力机制(LSG),高效处理长文本
下载量 108
发布时间 : 3/2/2022
模型介绍
内容详情
替代品

模型简介

该模型针对法语长文本优化,在保持CamemBERT原有架构基础上引入LSG注意力机制,支持4096长度的上下文处理

模型特点

长上下文处理
支持长达4096个标记的序列处理,优于传统Transformer模型
高效注意力机制
采用局部+稀疏+全局(LSG)混合注意力模式,计算效率高于Longformer/BigBird
自适应序列长度
支持自动填充序列长度至块大小的整数倍,简化预处理流程
多种稀疏模式
提供6种稀疏注意力选择策略,可根据任务需求灵活配置

模型能力

法语文本理解
长文档处理
掩码语言建模
序列分类
文本特征提取

使用案例

文本理解
法语长文档分类
对法语长篇文章或文档进行主题分类
示例显示可有效处理300+单词的序列
语言建模
法语完形填空
预测被掩码的法语词汇
示例成功预测'Paris est la capitale de la France'