TVC 7B
TVC-7B 是基于 Qwen2-VL-7B-Instruct 的 70 亿参数模型,支持中英双语,具备 8K 标记的上下文窗口,擅长长链推理和多模态处理。
下载量 1,658
发布时间 : 3/6/2025
模型简介
TVC-7B 是一个多模态模型,能够处理图像到文本的转换任务,特别适合需要长链推理的场景。
模型特点
长链推理能力
支持 8K 标记的上下文窗口,适合处理需要多步推理的复杂任务。
多模态处理
能够同时处理图像和文本输入,实现图像到文本的转换。
双语支持
支持中英双语,适用于跨语言应用场景。
模型能力
图像文本转换
长链推理
多模态处理
中英双语理解
使用案例
视觉问答
图像内容推理
根据图像内容进行多步推理,回答复杂问题。
能够准确回答需要多步推理的视觉问题。
多模态交互
图像描述生成
根据图像生成详细的文本描述。
生成准确且详细的图像描述。
精选推荐AI模型
Qwen2.5 VL 7B Abliterated Caption It I1 GGUF
Apache-2.0
Qwen2.5-VL-7B-Abliterated-Caption-it的量化版本,支持多语言图像描述任务。
图像生成文本
Transformers 支持多种语言

Q
mradermacher
167
1
Nunchaku Flux.1 Dev Colossus
其他
Colossus Project Flux 的 Nunchaku 量化版本,旨在根据文本提示生成高质量图像。该模型在优化推理效率的同时,将性能损失降至最低。
图像生成 英语
N
nunchaku-tech
235
3
Qwen2.5 VL 7B Abliterated Caption It GGUF
Apache-2.0
这是一个基于Qwen2.5-VL-7B模型的静态量化版本,专注于图像描述生成任务,支持多种语言。
图像生成文本
Transformers 支持多种语言

Q
mradermacher
133
1
Olmocr 7B 0725 FP8
Apache-2.0
olmOCR-7B-0725-FP8是基于Qwen2.5-VL-7B-Instruct模型,使用olmOCR-mix-0225数据集微调后量化为FP8版本的文档OCR模型。
图像生成文本
Transformers 英语

O
allenai
881
3
Lucy 128k GGUF
Apache-2.0
Lucy-128k是基于Qwen3-1.7B开发的专注于代理式网络搜索和轻量级浏览的模型,在移动设备上也能高效运行。
大型语言模型
Transformers 英语

L
Mungert
263
2