C

Csm 1b Safetensors Quants

由 lunahr 开发
CSM(对话语音模型)是Sesame开发的10亿参数语音生成模型,可通过文本和音频输入生成RVQ音频编码。
下载量 37
发布时间 : 3/15/2025
模型介绍
内容详情
替代品

模型简介

基于Llama主干网络和轻量级音频解码器的语音生成模型,支持文本转语音功能,输出Mimi音频编码。

模型特点

多说话人支持
可通过speaker参数控制不同说话人音色
上下文感知生成
支持通过上下文音频片段增强生成效果
安全张量格式
支持多种安全张量格式并统计下载量

模型能力

文本转语音
多说话人语音生成
上下文感知语音合成

使用案例

语音交互
对话系统语音输出
与LLM结合构建完整对话系统
交互式语音演示已在博客展示
内容创作
有声内容生成
自动生成播客、有声书等语音内容