F

Fish Agent V0.1 3b

由 fishaudio 开发
一款突破性的语音转语音模型,能够精确捕捉并生成环境音频信息,同时具备先进的文本转语音能力。
下载量 653
发布时间 : 10/29/2024
模型介绍
内容详情
替代品

模型简介

鱼语智能代理 V0.1 3B版是一款多功能语音处理模型,支持语音转语音和文本转语音任务,采用无语义标记的架构设计,无需依赖传统语义编码器/解码器。

模型特点

无语义标记架构
无需依赖Whisper或CosyVoice等传统语义编码器/解码器,实现更高效的语音处理
多语言支持
支持8种语言的语音处理,包括中文、英语等主要语言
大规模训练数据
基于70万小时的多语言音频数据集训练,确保模型性能
多功能语音处理
同时支持语音转语音和文本转语音任务,应用场景广泛

模型能力

语音转语音
文本转语音
语音转文本
多语言语音处理

使用案例

语音合成
多语言语音合成
将文本转换为自然流畅的语音输出
支持8种语言的语音合成
语音转换
语音风格转换
将输入语音转换为不同风格或特性的输出语音