端到端语音转文本

# 端到端语音转文本

Faster Whisper Small.en

基于OpenAI Whisper small.en模型的CTranslate2转换版本，用于高效语音识别

语音识别英语

Wav2vec2 Xls R 300m Mixed

基于Facebook的wav2vec2-xls-r-300m模型在混合语言数据集上微调的语音识别模型，支持马来语、新加坡式英语和普通话。

My Final Wav2vec2 Urdu Asr Project

这是一个基于wav2vec2架构的乌尔都语自动语音识别(ASR)模型，从头开始训练。

S2t Wav2vec2 Large En Tr

一个基于Transformer的端到端语音翻译模型，用于英语到土耳其语的语音转文本任务

Transformers 支持多种语言

Wav2vec2 Xls R 300m Ab CV8

该模型是基于facebook/wav2vec2-xls-r-300m在common_voice数据集上微调的版本，用于阿布哈兹语的自动语音识别任务。

Transformers 其他

S2t Wav2vec2 Large En Ar

基于Transformer的端到端语音翻译模型，支持英语到阿拉伯语的语音转文本翻译

Transformers 支持多种语言

Wav2vec2 Large Xlsr Georgian

这是一个基于facebook/wav2vec2-large-xlsr-53模型在格鲁吉亚语上进行微调的自动语音识别(ASR)模型，使用Common Voice数据集训练。

语音识别其他

Wav2vec2 Large Xlsr Hindi Demo Colab

该模型是基于facebook/wav2vec2-large-xlsr-53在common_voice数据集上微调的版本，用于印地语语音识别任务。

Hindi Wav2vec2 Stt

一个基于Wav2Vec2架构的印地语语音识别模型，可直接将音频转录为文本。

S2t Small Covost2 En Ca St

这是一个基于Transformer的端到端语音翻译模型，专门用于将英语语音翻译成加泰罗尼亚语文本。

Transformers 支持多种语言

Wav2vec2 Base 100h

Wav2Vec2基础版是在16kHz采样的Librispeech语音音频上进行了100小时预训练和微调的自动语音识别模型。

Transformers 英语

Wav2vec2 Large Xlsr 53 French

Facebook开发的基于Wav2Vec 2.0架构的大规模法语语音识别模型，支持自动语音转文本任务

语音识别法语

Wav2vec2 Large Xlsr 53 Lithuanian

基于Facebook的XLSR-53大模型微调的立陶宛语语音识别模型，在Common Voice数据集上训练，测试WER为56.55%。

语音识别其他

Asr Voxrex Bart Base

这是一个基于序列到序列架构的自动语音识别模型，能够将语音转换为文本。

精选推荐AI模型

Llama 3 Typhoon V1.5x 8b Instruct

专为泰语设计的80亿参数指令模型，性能媲美GPT-3.5-turbo，优化了应用场景、检索增强生成、受限生成和推理任务

大型语言模型

Transformers 支持多种语言

Cadet-Tiny是一个基于SODA数据集训练的超小型对话模型，专为边缘设备推理设计，体积仅为Cosmo-3B模型的2%左右。

Transformers 英语

Roberta Base Chinese Extractive Qa

基于RoBERTa架构的中文抽取式问答模型，适用于从给定文本中提取答案的任务。

问答系统中文

AIbase

智启未来，您的人工智能解决方案智库

简体中文

© 2025AIbase 备案号：闽ICP备08105208号-24