I

Indri 0.1 350m Tts

由 11mlabs 开发
Indri 是一个基于 Transformer 架构的新型、超小型、轻量级 TTS 模型,支持英语和印地语的文本转语音任务。
下载量 1,088
发布时间 : 11/20/2024
模型介绍
内容详情
替代品

模型简介

该模型将音频建模为标记,可以生成高质量的音频,并保持说话者风格的一致性。支持语音克隆和代码混合文本输入。

模型特点

小型轻量
基于 GPT-2 中等架构,体积小但性能强大
超快推理
在 RTX6000Ada GPU 上可达 300 toks/s 的生成速度,首次标记时间低于 20ms
语音克隆
支持基于短提示(<5秒)的说话者风格克隆
多语言支持
支持英语和印地语的代码混合输入
批量处理
在 RTX6000Ada 上支持约300个序列的批量处理

模型能力

文本转语音
语音克隆
多语言语音合成
批量语音生成

使用案例

内容创作
有声读物生成
为电子书自动生成高质量的有声版本
提供多种说话者风格选择
教育内容
为教育材料生成多语言语音内容
支持英语和印地语混合内容
商业应用
语音助手
为应用程序集成自然语音输出
低延迟响应
广告内容
快速生成不同风格的广告语音
支持多种说话者风格