Q

Qwen2.5 Omni 7B AWQ

由 Qwen 开发
Qwen2.5-Omni是一款端到端多模态模型,能够感知包括文本、图像、音频和视频在内的多种模态,同时以流式方式生成文本和自然语音响应。
下载量 77
发布时间 : 5/14/2025
模型介绍
内容详情
替代品

模型简介

Qwen2.5-Omni是一款支持全模态感知和生成的多模态模型,具备文本、图像、音频和视频处理能力,并能实时生成文本和语音响应。

模型特点

全模态感知与生成
支持文本、图像、音频和视频多种模态的感知和生成
实时语音与视频聊天
专为完全实时交互设计,支持分块输入和即时输出
自然语音生成
在语音生成方面展现出卓越的稳健性和自然度
跨模态强劲性能
在所有模态上均表现出色,音频能力超越同规模模型
端到端语音指令跟随
在端到端语音指令跟随方面的表现与文本输入相当

模型能力

文本生成
图像分析
语音识别
语音合成
视频理解
多模态交互

使用案例

智能助手
多模态对话
支持语音、图像和文本的多模态交互
提供自然流畅的对话体验
内容生成
语音合成
将文本转换为自然语音
生成高质量语音输出