V

Vintern 3B R Beta

由 5CD-AI 开发
Vintern-3B-R-beta是一个多模态大语言模型,专注于基于图像的复杂推理任务,能分解推理步骤并有效控制幻觉现象。
下载量 1,841
发布时间 : 3/19/2025
模型介绍
内容详情
替代品

模型简介

该模型结合了视觉和语言处理能力,擅长处理结构化文档图像和复杂问题推理,支持越南语、英语和中文。

模型特点

复杂推理能力
能够基于图像进行长链条复杂推理,将推理步骤分解为多个子步骤
多语言支持
支持越南语、英语和中文三种语言处理
幻觉控制
在推理过程中有效控制幻觉现象的产生
多模态处理
结合视觉和语言处理能力,处理结构化文档图像

模型能力

图像理解
复杂推理
多语言文本生成
结构化文档处理
OCR文本提取

使用案例

餐饮行业
菜单价格分析
从餐厅菜单图像中提取菜品信息并比较价格
准确识别最高价菜品
政府文档处理
公文文本提取
从政府公文图像中提取完整文本内容
准确提取越南语政府公文内容