T

Typhoon Ocr 7b

由 scb10x 开发
专为泰英双语现实场景文档解析打造的视觉语言模型,基于Qwen2.5-VL-Instruction框架
下载量 126
发布时间 : 5/14/2025
模型介绍
内容详情
替代品

模型简介

专注于泰英双语文档的OCR识别与结构化解析,支持复杂版式文档处理和多层视觉分析

模型特点

泰英双语支持
专门优化泰语和英语混合文档的识别能力
复杂文档解析
能处理财务报表、政府表格等结构化文档以及收据、菜单等版式复杂文档
多层视觉分析
支持元素识别、上下文分析、文本提取、艺术结构分析和综合摘要生成
结构化输出
输出支持Markdown、HTML表格和<figure>标签,保持原始文档结构

模型能力

泰英双语OCR识别
文档结构化解析
表格数据提取
图表分析
多语言混合内容处理
复杂版式文档理解

使用案例

金融文档处理
财务报表解析
从复杂的财务报表中提取结构化数据
超越GPT-4o和Gemini 2.5 Flash的性能
政府文件处理
政府表格解析
自动识别和提取政府表格中的关键信息
高精度结构化输出
教育资料处理
学术论文解析
提取论文中的文本、图表和参考文献信息
支持Markdown和HTML格式输出