G

Gemma 3n E4B It Litert Preview GGUF

由 unsloth 开发
Gemma-3n-E4B-it-litert-preview是基于Google的Gemma 3n模型微调的版本,支持图像和文本输入并生成文本输出,适用于多模态任务。
下载量 134
发布时间 : 7/8/2025

模型简介

Gemma是Google推出的轻量级、最先进的开源模型系列,基于与Gemini模型相同的研究和技术构建。Gemma 3n模型专为在低资源设备上高效运行而设计,支持多模态输入,包括文本、图像、视频和音频,并生成文本输出。

模型特点

多模态输入支持
支持文本、图像、视频和音频输入,并生成文本输出。
高效运行
专为在低资源设备上高效运行而设计,适合资源受限的环境。
高性能
在多种基准测试中表现出色,特别是在推理与事实性任务中。
广泛的语言支持
训练数据包含超过140种语言的内容,支持多语言任务。

模型能力

文本生成
图像分析
音频转录
多模态任务处理

使用案例

内容生成
图像描述生成
根据输入的图像生成详细的描述文本。
生成准确且详细的图像描述。
文档摘要
对输入的文档进行总结,生成简洁的摘要。
生成高质量的文档摘要。
问答系统
多模态问答
结合图像和文本输入回答问题。
提供准确的答案,特别是在视觉相关的问题上。
AIbase
智启未来,您的人工智能解决方案智库
简体中文