D

Dolphin Vision 72b

由 dphn 开发
DolphinVision 72b是一个多模态模型,能够对其他流行模型会拒绝处理的图像进行推理和评论。
下载量 296
发布时间 : 6/28/2024

模型简介

DolphinVision 72b是一个未经审查的多模态模型,由Quan Nguyen、Eric Hartford和Cognitive Computations精心策划并训练而成,能够处理图像和文本的多模态任务。

模型特点

多模态能力
能够同时处理图像和文本,进行复杂的多模态推理。
未经审查
能够对其他流行模型会拒绝处理的图像进行推理和评论。
高性能
在多个基准测试中表现优异,接近或超过GPT-4V的性能。

模型能力

图像描述
文本生成
OCR识别
多模态推理

使用案例

图像分析
OCR文本识别
从图像中提取并识别文本内容。
准确识别图像中的讽刺性文本内容。
内容生成
图像描述生成
根据图像生成详细的描述性文本。
生成准确且详细的图像描述。
AIbase
智启未来,您的人工智能解决方案智库
简体中文