Layoutreader
一款阅读顺序预测模型,可将从PDF提取或通过OCR检测的文本框转换为可读顺序。
下载量 139.61k
发布时间 : 2/28/2024
模型简介
该模型主要用于处理从PDF或OCR获取的文本布局,预测合理的阅读顺序,提升文档的可读性。
模型特点
阅读顺序优化
能够自动优化从PDF或OCR获取的文本布局,生成符合人类阅读习惯的顺序。
多格式支持
支持处理从PDF提取或OCR检测的文本框,适应多种输入格式。
模型能力
文本布局分析
阅读顺序预测
文档结构优化
使用案例
文档处理
PDF文档重排
将扫描PDF中的杂乱文本重新排列为可读顺序
提升PDF文档的可读性和可用性
OCR后处理
优化OCR识别结果的文本顺序
使OCR输出更符合自然阅读顺序
精选推荐AI模型
Llama 3 Typhoon V1.5x 8b Instruct
专为泰语设计的80亿参数指令模型,性能媲美GPT-3.5-turbo,优化了应用场景、检索增强生成、受限生成和推理任务
大型语言模型
Transformers 支持多种语言

L
scb10x
3,269
16
Cadet Tiny
Openrail
Cadet-Tiny是一个基于SODA数据集训练的超小型对话模型,专为边缘设备推理设计,体积仅为Cosmo-3B模型的2%左右。
对话系统
Transformers 英语

C
ToddGoldfarb
2,691
6
Roberta Base Chinese Extractive Qa
基于RoBERTa架构的中文抽取式问答模型,适用于从给定文本中提取答案的任务。
问答系统 中文
R
uer
2,694
98
智启未来,您的人工智能解决方案智库
简体中文