Conformer架构

# Conformer架构

Asr Conformer Largescaleasr

这是一个基于SpeechBrain框架训练的端到端自动语音识别系统，使用Conformer架构在25,000小时英文语音数据上训练。

语音识别英语

Indicconformer Stt Ur Hybrid Ctc Rnnt Large

IndicConformer 是一个基于混合 CTC-RNNT 架构的 Conformer 自动语音识别模型，专门用于乌尔都语语音转录。

语音识别其他

Indicconformer Stt Ne Hybrid Ctc Rnnt Large

IndicConformer是一个基于混合CTC-RNNT架构的Conformer自动语音识别模型，专门针对尼泊尔语优化

语音识别其他

Indicconformer Stt Hi Hybrid Ctc Rnnt Large

IndicConformer是一个基于混合CTC-RNNT架构的Conformer自动语音识别(ASR)模型，支持印地语语音转录。

语音识别其他

基于Conformer架构的语音编码器，在450万小时无标注音频数据上预训练，支持143种以上语言

Transformers 支持多种语言

Fastspeech2 Conformer With Hifigan

整合FastSpeech2Conformer与HiFi-GAN的文本转语音模型，提供高效高质量的语音合成

Transformers 英语

Fastspeech2 Conformer

FastSpeech2Conformer是一个非自回归的文本转语音（TTS）模型，结合了FastSpeech2和Conformer架构的优势，能够快速高效地从文本生成高质量的语音。

Transformers 英语

Stt Rw Conformer Transducer Large

这是一个用于卢旺达语语音识别的Conformer-Transducer大型模型，能将语音转录为小写拉丁字母，支持空格和撇号。

语音识别其他

Stt Zh Conformer Transducer Large

这是一个用于转录普通话语音的大型Conformer-Transducer模型，参数约1.2亿，在AISHELL-2数据集上训练。

语音识别中文

Stt Fr Conformer Ctc Large

这是一个基于Conformer架构的法语自动语音识别(ASR)大模型，采用CTC损失函数，在超过1500小时的法语语音数据上训练而成。

语音识别法语

Stt De Conformer Transducer Large

这是一个用于德语自动语音识别的大型Conformer-Transducer模型，具有约1.2亿参数，支持将德语语音转录为文本。

语音识别德语

Stt En Conformer Transducer Xlarge

这是一个由NVIDIA开发的自动语音识别(ASR)模型，基于Conformer-Transducer架构，拥有约6亿参数，专门用于英语语音转录。

语音识别英语

Stt Kr Conformer Transducer Large

这是一个基于Conformer-Transducer架构的大规模韩语自动语音识别模型，在Ksponspeech数据集上训练，适用于韩语语音转录任务。

语音识别其他

Wav2vec2 Conformer Rope Large 100h Ft

基于Librispeech 100小时语音数据微调的Wav2Vec2 Conformer模型，采用旋转位置嵌入技术

Transformers 英语

Wav2vec2 Conformer Rel Pos Large 100h Ft

采用相对位置嵌入技术的Wav2Vec2-Conformer大型语音识别模型，基于Librispeech 100小时语音数据微调

Transformers 英语

Kan Bayashi Vctk Xvector Conformer Fastspeech2

基于ESPnet框架训练的文本转语音模型，使用VCTK数据集，支持多说话人语音合成

语音合成英语

Simpleoier Librispeech Asr Train Asr Conformer7 Wavlm Large Raw En Bpe5000 Sp

基于ESPnet框架训练的自动语音识别(ASR)模型，使用Conformer架构和WavLM大型预训练模型，在LibriSpeech数据集上训练。

语音识别英语

Kan Bayashi Ljspeech Joint Finetune Conformer Fastspeech2 Hifigan

这是一个基于 ESPnet2 的文本转语音(TTS)模型，使用 LJSpeech 数据集训练，结合了 Conformer、FastSpeech2 和 HiFi-GAN 架构。

语音合成英语

精选推荐AI模型

Llama 3 Typhoon V1.5x 8b Instruct

专为泰语设计的80亿参数指令模型，性能媲美GPT-3.5-turbo，优化了应用场景、检索增强生成、受限生成和推理任务

大型语言模型

Transformers 支持多种语言

Cadet-Tiny是一个基于SODA数据集训练的超小型对话模型，专为边缘设备推理设计，体积仅为Cosmo-3B模型的2%左右。

Transformers 英语

Roberta Base Chinese Extractive Qa

基于RoBERTa架构的中文抽取式问答模型，适用于从给定文本中提取答案的任务。

问答系统中文

AIbase

智启未来，您的人工智能解决方案智库

简体中文

© 2025AIbase 备案号：闽ICP备08105208号-24