O

Orpheus

由 atharva27 开发
基于Llama架构的尖端语音大模型,专为高质量、富有同理心的文本转语音生成而设计
下载量 20
发布时间 : 5/3/2025

模型简介

经过微调的3B参数TTS模型,可实现人类级别的语音合成效果,在清晰度、表现力和实时流式处理方面表现卓越

模型特点

拟人化语音
自然语调、情感和节奏超越当前闭源最优模型
零样本声音克隆
无需预训练即可克隆声音
可控情感与语调
通过简单标签控制语音情感特征
低延迟
实时应用场景下约200毫秒流式延迟,输入流式处理时可降至100毫秒

模型能力

高质量语音合成
情感控制语音生成
实时流式处理
声音克隆

使用案例

语音合成
有声读物生成
生成富有情感的有声读物内容
自然流畅的语音输出
虚拟助手
为虚拟助手提供更自然的语音交互
拟人化的语音响应
实时应用
实时语音播报
用于需要低延迟的实时语音播报场景
200毫秒以下的流式延迟
AIbase
智启未来,您的人工智能解决方案智库
简体中文