O

Orpheus 3b 0.1 Ft

由 audo 开发
基于Llama架构的尖端语音大模型,专为高质量、富有同理心的文本转语音生成而设计
下载量 240
发布时间 : 3/21/2025

模型简介

Orpheus TTS是基于Llama架构的语音合成模型,经过微调可实现人类水平的语音合成,在清晰度、表现力和实时流式处理方面表现卓越。

模型特点

拟真语音
自然语调、情感与节奏超越现有闭源SOTA模型
零样本声音克隆
无需预训练即可克隆声音
可控情感语调
通过简单标签控制语音情感特征
低延迟
实时应用场景下约200ms流式延迟,输入流式处理时可降至约100ms

模型能力

高质量语音合成
声音克隆
情感控制语音生成
实时流式语音处理

使用案例

语音合成
有声读物生成
为电子书自动生成高质量语音
自然流畅的朗读效果
虚拟助手语音
为虚拟助手提供富有表现力的语音
更自然的交互体验
声音克隆
个性化语音服务
根据少量样本克隆特定声音
无需大量训练即可实现个性化语音
AIbase
智启未来,您的人工智能解决方案智库
简体中文