orpheus-3b-0.1-ft开源文本转语音模型 - 支持情感控制与音色克隆

首页

Orpheus 3b 0.1 Ft

由 chutesai 开发

基于Llama架构的高质量文本转语音模型，支持情感控制和音色克隆

语音合成

Transformers

英语开源协议:Apache-2.0 #拟真语音合成 #零样本音色克隆 #情感可控TTS

下载量 2,686

发布时间 : 3/24/2025

模型简介

Orpheus TTS是基于Llama架构的语音大模型，通过微调实现人类级别的语音合成效果，在清晰度、表现力和实时流式处理方面表现卓越。

模型特点

拟真语音

自然语调、情感与节奏表现超越当前闭源最优模型

零样本音色克隆

无需预训练即可克隆目标音色

可控情感语调

通过简单标签调控语音情感特征

低延迟处理

实时场景下约200ms流式延迟，配合输入流可降至100ms

模型能力

高质量语音合成

情感语音生成

音色克隆

流式语音输出

使用案例

语音交互

虚拟助手

为虚拟助手提供自然流畅的语音输出

提升用户体验和交互自然度

有声读物

自动生成富有表现力的有声读物

降低内容制作成本

辅助技术

语音辅助

为视障人士提供高质量的语音输出

提升辅助技术的可用性

属性	详情
库名称	transformers
语言	英文
任务类型	文本转语音
许可证	Apache-2.0
基础模型	meta-llama/Llama-3.2-3B-Instruct、canopylabs/orpheus-3b-0.1-pretrained

精选推荐AI模型

Llama 3 Typhoon V1.5x 8b Instruct

专为泰语设计的80亿参数指令模型，性能媲美GPT-3.5-turbo，优化了应用场景、检索增强生成、受限生成和推理任务

Cadet-Tiny是一个基于SODA数据集训练的超小型对话模型，专为边缘设备推理设计，体积仅为Cosmo-3B模型的2%左右。

Roberta Base Chinese Extractive Qa

基于RoBERTa架构的中文抽取式问答模型，适用于从给定文本中提取答案的任务。

问答系统中文

uer

2,694

智启未来，您的人工智能解决方案智库

简体中文

Orpheus 3b 0.1 Ft

模型简介

模型特点

模型能力

使用案例

🚀 Orpheus 3B 0.1 微调模型

🚀 快速开始

✨ 主要特性

模型能力

模型资源

💻 使用示例

📚 详细文档

模型滥用说明

📄 许可证