S

Smoldocling 256M Preview Mlx Fp16

由 ahishamm 开发
该模型是从 ds4sd/SmolDocling-256M-preview 转换为 MLX 格式的视觉语言模型,支持图像文本到文本任务。
下载量 24
发布时间 : 3/17/2025

模型简介

SmolDocling-256M-preview-mlx-fp16 是一个基于 MLX 框架的视觉语言模型,主要用于处理图像文本到文本的任务。它是从原始模型 ds4sd/SmolDocling-256M-preview 转换而来,适用于在苹果芯片上高效运行。

模型特点

MLX 格式优化
该模型已转换为 MLX 格式,特别适合在苹果芯片上高效运行。
视觉语言处理
支持图像文本到文本的任务,能够理解和生成与图像相关的文本内容。
轻量级模型
参数规模为 256M,适合在资源有限的环境中部署和使用。

模型能力

图像文本理解
文本生成
视觉语言任务处理

使用案例

文档处理
图像文档解析
从图像中提取文本信息并生成结构化文本。
多模态应用
图像描述生成
根据输入图像生成描述性文本。
AIbase
智启未来,您的人工智能解决方案智库
简体中文