L

Llama OuteTTS 1.0 1B GPTQ 8bit

由 adriabama06 开发
OuteTTS 1.0是一个1B参数的文本转语音模型,支持多语言语音合成与声音克隆
下载量 15
发布时间 : 4/7/2025
模型介绍
内容详情
替代品

模型简介

基于Llama3.2架构的语音合成模型,通过DAC编码器实现高保真音频重建,支持17种主要语言的文本转语音和声音克隆功能

模型特点

多语言原生支持
直接支持23种语言的文本输入,无需罗马音转换等预处理
高效声音克隆
仅需10秒参考音频即可生成精准声纹克隆
智能文本对齐
自动处理无明确边界语言(如日语/中文)的词语对齐
DAC音频编码器
采用IBM Research的高保真双编码簿架构,音频质量显著提升

模型能力

文本转语音合成
跨语言语音转换
声音特征克隆
情感语音生成
长文本语音合成(最长42秒)

使用案例

辅助技术
无障碍阅读
为视障用户转换文本内容为语音
支持多语言自然语音输出
内容创作
有声内容制作
快速生成播客/视频配音
可克隆特定主播声线
教育技术
语言学习工具
生成多语言发音示范
支持23种语言原生发音