Typhoon Ocr 7b
专为泰英双语现实场景文档解析打造的视觉语言模型,基于Qwen2.5-VL-Instruction框架
图像生成文本
Transformers

支持多种语言
T
scb10x
126
9
Qwen2 VL 2B OCR
Apache-2.0
Qwen2-VL-2B-OCR是基于unsloth/Qwen2-VL-2B-Instruct微调的OCR模型,专注于从文档、表格和工资单图像中提取完整文本。
图像生成文本
Transformers

英语
Q
JackChew
842
4
Sk Invoice Receipts
Apache-2.0
基于Donut架构微调的实验性模型,专用于将发票或收据图像转换为XML或JSON数据结构,无需传统OCR引擎。
图像生成文本
Transformers

S
selvakumarcts
201
39
Invoice And Receipts Donut V1
Apache-2.0
基于Donut架构的大型语言模型,专为发票和收据图像转换为结构化数据而设计
图像生成文本
Transformers

I
mychen76
2,945
54
Tatr Tab Struct V2
基于PubTables1M和FinTabNet数据集训练的DETR架构模型,专用于表格结构识别任务
文字识别
Transformers

T
deepdoctection
99
2
Layout Xlm Base Finetuned With DocLayNet Base At Linelevel Ml384
MIT
基于LayoutXLM基础模型在DocLayNet数据集上微调的行级别文档理解模型,支持多语言文档布局分析和标记分类。
文字识别
Transformers

支持多种语言
L
pierreguillou
103
3
Lilt Xlm Roberta Base Finetuned With DocLayNet Base At Paragraphlevel Ml512
MIT
这是一个文档理解模型,专门用于分析文档布局和内容,在段落级别进行标记分类任务。
文字识别
Transformers

支持多种语言
L
pierreguillou
126
3
Lilt Xlm Roberta Base Finetuned With DocLayNet Base At Linelevel Ml384
MIT
基于LiLT和DocLayNet数据集微调的行级别文档理解模型,支持多语言文档布局分析
图像生成文本
Transformers

支持多种语言
L
pierreguillou
700
12
Donut Base Payslips
MIT
基于Donut架构的文档理解模型,专门针对工资单图像处理进行微调
文字识别
Transformers

D
Assadullah
20
0
精选推荐AI模型
Llama 3 Typhoon V1.5x 8b Instruct
专为泰语设计的80亿参数指令模型,性能媲美GPT-3.5-turbo,优化了应用场景、检索增强生成、受限生成和推理任务
大型语言模型
Transformers

支持多种语言
L
scb10x
3,269
16
Cadet Tiny
Openrail
Cadet-Tiny是一个基于SODA数据集训练的超小型对话模型,专为边缘设备推理设计,体积仅为Cosmo-3B模型的2%左右。
对话系统
Transformers

英语
C
ToddGoldfarb
2,691
6
Roberta Base Chinese Extractive Qa
基于RoBERTa架构的中文抽取式问答模型,适用于从给定文本中提取答案的任务。
问答系统
中文
R
uer
2,694
98
AIbase是一个专注于MCP服务的平台,为AI开发者提供高质量的模型上下文协议服务,助力AI应用开发。
简体中文