M

Markuplm Base Finetuned Websrc

由 microsoft 开发
MarkupLM是一种针对富视觉文档理解与信息抽取任务的多模态预训练模型,结合文本与标记语言信息。
下载量 168
发布时间 : 6/14/2022
模型介绍
内容详情
替代品

模型简介

该模型专为网页问答和网页信息抽取等任务设计,通过结合文本内容和HTML标记结构实现更精准的文档理解。

模型特点

多模态理解
同时处理文本内容和HTML标记结构,实现更全面的文档理解
网页专用优化
专门针对网页内容进行优化,在WebSRC等网页数据集上表现优异
简洁高效设计
模型设计简洁但效果显著,在多个基准测试中达到SOTA性能

模型能力

网页内容理解
结构化信息抽取
网页问答
文档智能处理

使用案例

网页信息处理
网页问答系统
基于网页内容回答用户提出的问题
在WebSRC数据集上取得优异表现
网页数据抽取
从网页中提取结构化数据
文档智能
富文本文档分析
解析包含丰富格式的文档内容