L

Layoutlm Wikipedia Ja

由 jri-advtechlab 开发
这是一个基于日语文本预训练的LayoutLM模型,主要用于处理日语文档的令牌分类任务。
下载量 22
发布时间 : 1/31/2024
模型介绍
内容详情
替代品

模型简介

该模型是基于日语维基百科训练的LayoutLM模型,主要用于微调以完成令牌分类任务,也可用于掩码语言建模。

模型特点

日语文本处理
专门针对日语文本进行预训练,适用于日语文档处理任务。
布局感知
结合文本内容和布局信息(如边界框)进行建模,适用于文档理解任务。
基于BERT架构
基于cl-tohoku/bert-base-japanese-v2模型进行初始化,继承了BERT的强大语言理解能力。

模型能力

令牌分类
掩码语言建模
文档布局理解

使用案例

文档信息提取
维基百科信息提取
从日语维基百科页面中提取结构化信息
在SHINRA 2022共享任务中获得55.1451的宏F1分数