R

Riffusion Model V1

由 riffusion 开发
Riffusion是一款基于稳定扩散技术的实时音乐生成应用,可根据文本输入生成频谱图并转换为音频片段。
下载量 2,354
发布时间 : 12/13/2022
模型介绍
内容详情
替代品

模型简介

Riffusion是一种潜在文本-图像扩散模型,通过微调Stable-Diffusion-v1-5检查点实现音乐频谱图生成,可转换为音频片段。

模型特点

实时音乐生成
能够根据文本提示实时生成音乐频谱图并转换为音频片段
基于稳定扩散技术
采用经过微调的Stable-Diffusion-v1-5模型架构,具备强大的生成能力
开放许可
采用CreativeML OpenRAIL-M许可证,允许商用和研究用途

模型能力

文本到频谱图生成
频谱图到音频转换
实时音乐创作
创意音频生成

使用案例

艺术创作
音乐作品生成
根据文本描述自动生成原创音乐片段
生成可播放的音频文件
教育工具
音乐概念教学
通过可视化频谱图辅助音乐理论教学
直观展示音频与频谱的关系
研究开发
生成模型研究
探索跨模态(文本-音频)生成技术