端到端语音识别

# 端到端语音识别

FunASR是一个致力于连接语音识别学术研究与工业应用的基础工具包，支持语音识别、语音活动检测、标点恢复等多种功能。

Faster Whisper Base.en

这是一个基于CTranslate2转换的Whisper base.en模型，用于英语语音识别任务。

语音识别英语

Assignment1 Francesco

基于语音到文本转换器(S2T)训练的自动语音识别(ASR)模型，专为英语语音识别设计

Transformers 英语

Classroom-workshop

Assignment1 Maria

s2t-small-librispeech-asr 是一个用于自动语音识别（ASR）的语音到文本转换器（S2T）模型，基于序列到序列的转换器架构。

Transformers 英语

Classroom-workshop

Assignment1 Joane

一个用于自动语音识别(ASR)的语音到文本转换器(S2T)模型

Transformers 英语

Classroom-workshop

Assignment1 Jack

一个用于自动语音识别(ASR)的语音到文本转换器(S2T)模型，基于序列到序列转换器架构

Transformers 英语

Classroom-workshop

Assignment1 Jane

s2t-small-librispeech-asr 是一个用于自动语音识别（ASR）的语音到文本转换器（S2T）模型，基于序列到序列转换器架构。

Transformers 英语

Classroom-workshop

Wav2vec2 Base Turkish Cv8

这是一个基于Common Voice 8.0土耳其语数据集微调的自动语音识别(ASR)模型，能够将土耳其语语音转换为文本。

Transformers 其他

Asr Wav2vec2 Commonvoice Rw

这是一个用于卢旺达语自动语音识别的端到端模型，基于wav2vec 2.0预训练模型结合CTC和注意力机制，在CommonVoice数据集上微调。

语音识别其他

S2t Small Librispeech Asr

一个用于自动语音识别（ASR）的语音到文本转换器（S2T）模型，基于序列到序列转换器架构

Transformers 英语

Wav2vec2 Marathi Stt

这是一个基于Wav2Vec2架构的马拉地语（Marathi）语音识别模型，可直接将语音转换为文本。

S2t Large Librispeech Asr

一个用于自动语音识别(ASR)的端到端序列到序列转换器模型，基于LibriSpeech数据集训练

Transformers 英语

Kamo Naoyuki Mini An4 Asr Train Raw Bpe Valid.acc.best

这是一个基于ESPnet2框架训练的自动语音识别(ASR)预训练模型，使用mini-an4数据集训练，支持英文语音识别。

语音识别英语

S2t Medium Librispeech Asr

一个用于自动语音识别(ASR)的语音到文本转换器(S2T)模型，基于序列到序列转换器架构

Transformers 英语

精选推荐AI模型

Llama 3 Typhoon V1.5x 8b Instruct

专为泰语设计的80亿参数指令模型，性能媲美GPT-3.5-turbo，优化了应用场景、检索增强生成、受限生成和推理任务

大型语言模型

Transformers 支持多种语言

Cadet-Tiny是一个基于SODA数据集训练的超小型对话模型，专为边缘设备推理设计，体积仅为Cosmo-3B模型的2%左右。

Transformers 英语

Roberta Base Chinese Extractive Qa

基于RoBERTa架构的中文抽取式问答模型，适用于从给定文本中提取答案的任务。

问答系统中文

AIbase

智启未来，您的人工智能解决方案智库

简体中文

© 2025AIbase 备案号：闽ICP备08105208号-24