Orpheus 3b 0.1 Ft

O

Orpheus 3b 0.1 Ft

由 audo 开发

基于Llama架构的尖端语音大模型，专为高质量、富有同理心的文本转语音生成而设计

英语开源协议:Apache-2.0 #零样本声音克隆 #情感可控语音合成 #低延迟流式TTS

下载量 240

发布时间 : 3/21/2025

模型简介

Orpheus TTS是基于Llama架构的语音合成模型，经过微调可实现人类水平的语音合成，在清晰度、表现力和实时流式处理方面表现卓越。

模型特点

拟真语音

自然语调、情感与节奏超越现有闭源SOTA模型

零样本声音克隆

无需预训练即可克隆声音

可控情感语调

通过简单标签控制语音情感特征

低延迟

实时应用场景下约200ms流式延迟，输入流式处理时可降至约100ms

模型能力

高质量语音合成

声音克隆

情感控制语音生成

实时流式语音处理

使用案例

语音合成

有声读物生成

为电子书自动生成高质量语音

自然流畅的朗读效果

虚拟助手语音

为虚拟助手提供富有表现力的语音

更自然的交互体验

声音克隆

个性化语音服务

根据少量样本克隆特定声音

无需大量训练即可实现个性化语音

精选推荐AI模型

Llama 3 Typhoon V1.5x 8b Instruct

专为泰语设计的80亿参数指令模型，性能媲美GPT-3.5-turbo，优化了应用场景、检索增强生成、受限生成和推理任务

大型语言模型

Transformers 支持多种语言

Cadet-Tiny是一个基于SODA数据集训练的超小型对话模型，专为边缘设备推理设计，体积仅为Cosmo-3B模型的2%左右。

Transformers 英语

Roberta Base Chinese Extractive Qa

基于RoBERTa架构的中文抽取式问答模型，适用于从给定文本中提取答案的任务。

问答系统中文

AIbase

智启未来，您的人工智能解决方案智库

简体中文

© 2025AIbase 备案号：闽ICP备08105208号-24