P

Perceiver Ar Sam Giant Midi

由 krasserm 开发
基于Perceiver AR架构的符号音频模型,在GiantMIDI-Piano数据集上预训练,用于符号音频生成
下载量 153
发布时间 : 5/3/2023
模型介绍
内容详情
替代品

模型简介

该模型是一个基于Perceiver AR架构的符号音频模型,主要用于基于用户定义初始潜在标记数量的音频生成。

模型特点

长上下文处理能力
通过混合自注意力与交叉注意力机制,可处理比纯自注意力解码器更长的上下文(最长6144个标记)。
旋转位置编码
采用旋转位置编码进行相对位置编码,提升模型对序列位置关系的理解能力。
符号音频建模
专门针对MIDI格式的符号音频数据进行建模和生成。

模型能力

符号音频生成
音乐续写
MIDI文件生成

使用案例

音乐创作
音乐片段续写
基于用户提供的音乐片段提示,自动生成后续音乐内容
可生成风格连贯的音乐续写片段
音乐风格模仿
通过学习特定风格的MIDI数据,生成类似风格的音乐
可模仿训练数据中的音乐风格特征
教育娱乐
音乐创作辅助
为音乐学习者提供创作灵感和素材
可生成简单旋律供学习和改编