Orpheus

O

Orpheus

由 atharva27 开发

基于Llama架构的尖端语音大模型，专为高质量、富有同理心的文本转语音生成而设计

英语开源协议:Apache-2.0 #零样本声音克隆 #情感可控语音合成 #低延迟流式TTS

下载量 20

发布时间 : 5/3/2025

模型简介

经过微调的3B参数TTS模型，可实现人类级别的语音合成效果，在清晰度、表现力和实时流式处理方面表现卓越

模型特点

拟人化语音

自然语调、情感和节奏超越当前闭源最优模型

零样本声音克隆

无需预训练即可克隆声音

可控情感与语调

通过简单标签控制语音情感特征

低延迟

实时应用场景下约200毫秒流式延迟，输入流式处理时可降至100毫秒

模型能力

高质量语音合成

情感控制语音生成

实时流式处理

声音克隆

使用案例

语音合成

有声读物生成

生成富有情感的有声读物内容

自然流畅的语音输出

虚拟助手

为虚拟助手提供更自然的语音交互

拟人化的语音响应

实时应用

实时语音播报

用于需要低延迟的实时语音播报场景

200毫秒以下的流式延迟

精选推荐AI模型

Llama 3 Typhoon V1.5x 8b Instruct

专为泰语设计的80亿参数指令模型，性能媲美GPT-3.5-turbo，优化了应用场景、检索增强生成、受限生成和推理任务

大型语言模型

Transformers 支持多种语言

Cadet-Tiny是一个基于SODA数据集训练的超小型对话模型，专为边缘设备推理设计，体积仅为Cosmo-3B模型的2%左右。

Transformers 英语

Roberta Base Chinese Extractive Qa

基于RoBERTa架构的中文抽取式问答模型，适用于从给定文本中提取答案的任务。

问答系统中文

AIbase

智启未来，您的人工智能解决方案智库

简体中文

© 2025AIbase 备案号：闽ICP备08105208号-24