模型简介
海豚是一种用于文档图像解析的多模态模型,能够处理文本段落、图表、公式和表格等复杂交织的文档元素。它通过两阶段方法实现全面的页面级布局分析和高效的元素级解析。
模型特点
两阶段解析方法
先进行页面级布局分析,再进行元素级解析,有效处理复杂文档结构
异构锚点提示
使用自然语言提示控制解析任务,提高解析效率和准确性
并行解析机制
轻量级架构支持多种文档元素的并行解析,提高处理效率
多模态能力
同时处理视觉和文本信息,适用于复杂文档理解任务
模型能力
文档图像解析
版面分析
表格提取
光学字符识别
公式识别
图表理解
多模态处理
使用案例
文档数字化
扫描文档解析
将扫描的PDF或图像转换为结构化数字文档
保留原始文档的布局和内容结构
信息提取
表格数据提取
从文档图像中提取表格数据并转换为结构化格式
高精度的表格结构识别和数据提取
公式识别
识别文档中的数学公式并转换为可编辑格式
支持复杂数学符号和结构的识别
精选推荐AI模型
Llama 3 Typhoon V1.5x 8b Instruct
专为泰语设计的80亿参数指令模型,性能媲美GPT-3.5-turbo,优化了应用场景、检索增强生成、受限生成和推理任务
大型语言模型
Transformers

支持多种语言
L
scb10x
3,269
16
Cadet Tiny
Openrail
Cadet-Tiny是一个基于SODA数据集训练的超小型对话模型,专为边缘设备推理设计,体积仅为Cosmo-3B模型的2%左右。
对话系统
Transformers

英语
C
ToddGoldfarb
2,691
6
Roberta Base Chinese Extractive Qa
基于RoBERTa架构的中文抽取式问答模型,适用于从给定文本中提取答案的任务。
问答系统
中文
R
uer
2,694
98
AIbase是一个专注于MCP服务的平台,为AI开发者提供高质量的模型上下文协议服务,助力AI应用开发。
简体中文