C

Csm Expressiva 1b

由 senstella 开发
基于CSM-1b对话语音模型微调的情感语音模型,支持耳语风格语音合成
下载量 105
发布时间 : 4/10/2025
模型介绍
内容详情
替代品

模型简介

本模型通过SFT微调CSM基础模型,采用Expresso数据集中的耳语风格语音数据,验证了csm-mlx代码库的LoRA微调效果,能够生成具有特定情感特征的语音。

模型特点

耳语风格语音合成
能够生成具有特定耳语风格的情感语音
LoRA微调优化
使用低秩适应(LoRA)技术进行高效微调,保持基础模型能力的同时添加新特征
轻量级训练
可在16GB内存的MacBook Air上完成训练,适合资源有限的环境
稳定性提升
通过微调显著减少了基础模型的典型故障(如无限静音)

模型能力

文本转语音
情感语音合成
耳语风格生成

使用案例

语音合成
情感化语音助手
为语音助手添加耳语等情感化语音输出能力
能够生成自然的情感语音
有声内容创作
为有声书、播客等内容创作提供多样化语音风格
可生成特定风格的语音内容