K

Kimi Audio 7B Instruct

由 moonshotai 开发
金鸣音频是一个在音频理解、生成与对话方面表现卓越的开源音频基础模型,支持多种音频处理任务。
下载量 1,626
发布时间 : 4/25/2025
模型介绍
内容详情
替代品

模型简介

金鸣音频是一个通用音频基础模型,能在统一框架下处理多种音频处理任务,包括语音识别、音频问答、音频描述、语音情感识别等。

模型特点

全能处理能力
支持多种音频处理任务,包括语音识别、音频问答、音频描述、语音情感识别等。
顶尖性能表现
在多项音频基准测试中达到最先进水平。
超大规模预训练
基于超1300万小时的多样化音频数据(语音/音乐/环境声)及文本数据训练。
创新架构设计
采用混合音频输入与并行生成文本/音频标记的大语言模型核心架构。
高效推理部署
配备基于流匹配的块流式解码器,实现低延迟音频生成。

模型能力

音频理解
音频生成
语音识别
音频问答
音频描述
语音情感识别
声学事件分类
声学场景分类
端到端语音对话

使用案例

语音识别
音频转文本
将音频文件转换为文本内容。
高准确率的文本输出。
多模态对话
音频对话生成
根据输入的音频生成对话响应。
生成自然的对话音频和文本。