L

Layoutreader

由 hantian 开发
一款阅读顺序预测模型,可将从PDF提取或通过OCR检测的文本框转换为可读顺序。
下载量 139.61k
发布时间 : 2/28/2024

模型简介

该模型主要用于处理从PDF或OCR获取的文本布局,预测合理的阅读顺序,提升文档的可读性。

模型特点

阅读顺序优化
能够自动优化从PDF或OCR获取的文本布局,生成符合人类阅读习惯的顺序。
多格式支持
支持处理从PDF提取或OCR检测的文本框,适应多种输入格式。

模型能力

文本布局分析
阅读顺序预测
文档结构优化

使用案例

文档处理
PDF文档重排
将扫描PDF中的杂乱文本重新排列为可读顺序
提升PDF文档的可读性和可用性
OCR后处理
优化OCR识别结果的文本顺序
使OCR输出更符合自然阅读顺序
AIbase
智启未来,您的人工智能解决方案智库
简体中文