O

Orpheus 3b 0.1 Ft

由 chutesai 开发
基于Llama架构的高质量文本转语音模型,支持情感控制和音色克隆
下载量 2,686
发布时间 : 3/24/2025
模型介绍
内容详情
替代品

模型简介

Orpheus TTS是基于Llama架构的语音大模型,通过微调实现人类级别的语音合成效果,在清晰度、表现力和实时流式处理方面表现卓越。

模型特点

拟真语音
自然语调、情感与节奏表现超越当前闭源最优模型
零样本音色克隆
无需预训练即可克隆目标音色
可控情感语调
通过简单标签调控语音情感特征
低延迟处理
实时场景下约200ms流式延迟,配合输入流可降至100ms

模型能力

高质量语音合成
情感语音生成
音色克隆
流式语音输出

使用案例

语音交互
虚拟助手
为虚拟助手提供自然流畅的语音输出
提升用户体验和交互自然度
有声读物
自动生成富有表现力的有声读物
降低内容制作成本
辅助技术
语音辅助
为视障人士提供高质量的语音输出
提升辅助技术的可用性