Wav2Vec2架构

# Wav2Vec2架构

Indicwav2vec Hindi

基于Wav2Vec2架构的印地语自动语音识别模型，由AI4Bharat开发

Transformers 其他

Indicwav2vec Odia

基于Wav2Vec2架构的印地语自动语音识别(ASR)模型，由AI4Bharat开发

Transformers 其他

Audio Classification Model

基于facebook/wav2vec2-base-960h微调的音频分类模型，具体用途和训练数据未明确说明。

这是一个基于Wav2Vec2架构的语音语言识别模型，能够识别4017种语言，属于Facebook大规模多语言语音项目的一部分。

Transformers 支持多种语言

该模型是Facebook大规模多语言语音项目的一部分，基于Wav2Vec2架构，能够识别1024种语言的语音输入。

Transformers 支持多种语言

这是一个针对512种语言的语音语言识别(LID)进行微调的模型，基于Wav2Vec2架构，能够识别输入音频的语言类别。

Transformers 支持多种语言

这是一个基于Wav2Vec2架构的语音语言识别模型，能够识别256种语言，属于Facebook大规模多语言语音(MMS)项目的一部分。

Transformers 支持多种语言

基于Facebook大规模多语言语音项目微调的语言识别模型，支持126种语言的音频分类

Transformers 支持多种语言

Accent Determinator

基于Wav2Vec2架构的音频分类模型，用于识别波多黎各、哥伦比亚、委内瑞拉、秘鲁或智利西班牙语口音

Exp W2v2t It Vp Fr S821

基于facebook/wav2vec2-large-fr-voxpopuli模型微调的意大利语自动语音识别模型，使用Common Voice 7.0意大利语数据集训练

Transformers 其他

Exp W2v2t It Vp 100k S449

基于facebook/wav2vec2-large-100k-voxpopuli模型微调的意大利语自动语音识别模型，使用Common Voice 7.0意大利语数据集训练。

Transformers 其他

Wav2vec2 Ksponspeech

基于Ksponspeech数据集微调的韩语语音识别模型，在Wav2vec2-large-xlsr-53基础上优化

84rry Xls R 300M AR

该模型是基于facebook/wav2vec2-xls-r-300m在common_voice数据集上微调的阿拉伯语语音识别模型，在评估集上取得了0.5078的词错误率。

这是一个基于XLSR Wav2Vec2架构的印尼语自动语音识别模型，在公共语音印尼语数据集上进行了微调。

Transformers 其他

Chinese Hubert Base

基于1万小时WenetSpeech L子集预训练的中文语音模型，适用于语音相关任务

TencentGameMate

基于facebook/wav2vec2-base微调的语音识别模型，支持自动语音转文本任务。

基于facebook/wav2vec2-base微调的语音识别模型，在评估集上词错误率(WER)为1.0

Wav2vec2 Xlsr 53 Russian Emotion Recognition

这是一个基于XLS-R Wav2Vec2架构的俄语语音情感识别模型，能够识别7种基本情感，准确率达72%。

Transformers 其他

基于facebook/wav2vec2-base微调的语音识别模型，词错误率(WER)为1.0

该模型是基于facebook/wav2vec2-base-960h微调的语音识别模型，在评估集上词错误率(WER)为1.0。

English Filipino Wav2vec2 L Xls R Test 07

该模型是基于jonatasgrosman/wav2vec2-large-xlsr-53-english在菲律宾语音数据集上微调的版本，主要用于英语到菲律宾语的语音识别任务。

Wav2vec2 Base Timit Demo Colab3

基于facebook/wav2vec2-base模型在TIMIT数据集上微调的语音识别模型

Wav2vec2 Base Timit Demo Colab1

该模型是基于facebook/wav2vec2-base微调的语音识别模型，在TIMIT数据集上进行了训练和评估。

cuzeverynameistaken

Wav2vec2 Base Timit Demo Colab60

该模型是基于facebook/wav2vec2-base微调的语音识别模型，在TIMIT数据集上训练60轮，词错误率(WER)达到1.0。

Wav2vec2 Base Timit Demo Colab7

该模型是基于facebook/wav2vec2-base微调得到的语音识别模型，在TIMIT数据集上训练，词错误率(WER)为0.5426。

Wav2vec2 Base Timit Demo Colab7

基于facebook/wav2vec2-base模型在TIMIT数据集上微调的语音识别模型，主要用于英语语音转文本任务。

Wav2vec2 Base Timit Demo Colab3

该模型是基于facebook/wav2vec2-base微调的语音识别模型，在TIMIT数据集上训练，评估词错误率为0.5608。

Wav2vec2 Base Timit Demo Colab2

该模型是基于facebook/wav2vec2-base微调得到的语音识别模型，在评估集上取得了0.5664的词错误率(WER)。

Wav2vec2 Base Timit Demo Colab6

该模型是基于facebook/wav2vec2-base微调的语音识别模型，在TIMIT数据集上训练，词错误率(WER)为0.5282。

Wav2vec2 Base Timit Moaiz Explast

该模型是基于facebook/wav2vec2-base在TIMIT数据集上微调的语音识别模型，主要用于英语语音转文本任务。

Wav2vec2 Base Timit Demo Colab1

该模型是基于facebook/wav2vec2-base微调的语音识别模型，在TIMIT数据集上训练，词错误率(WER)为1.0。

Xlsr 53 Bemba 5hrs

基于facebook/wav2vec2-large-xlsr-53微调的语音识别模型，支持Bemba语

Ctrlv Wav2vec2 Tokenizer

基于facebook/wav2vec2-base微调的语音识别模型，在评估集上取得了31.38%的词错误率

Wav2vec2 Commonvoice Tamil

基于Harveenchadha/vakyansh-wav2vec2-tamil-tam-250在common_voice数据集上微调的泰米尔语语音识别模型

Wav2vec2 Base Toy Train Data Slow 10pct

基于facebook/wav2vec2-base模型在未知数据集上微调的语音识别模型，词错误率(WER)为0.7175

Wav2vec2 Base Toy Train Data Masked Audio 10ms

基于facebook/wav2vec2-base微调的语音识别模型，在10ms音频掩码任务上训练

基于wav2vec2架构的乌尔都语自动语音识别模型，在Common Voice数据集上微调

Transformers 其他

Wav2vec2 From Scratch Finetune Dummy

这是一个基于XLSR Wav2Vec2架构的印度尼西亚语自动语音识别模型，由cahya开发并在通用语音印度尼西亚语数据集上微调。

Transformers 其他

Wav2vec2 Tr AG V1

基于Wav2Vec2架构的土耳其语语音识别模型，针对土耳其语进行了优化。

Wav2vec2 Timit Demo

基于facebook/wav2vec2-base模型在TIMIT数据集上微调的语音识别模型

精选推荐AI模型

Llama 3 Typhoon V1.5x 8b Instruct

专为泰语设计的80亿参数指令模型，性能媲美GPT-3.5-turbo，优化了应用场景、检索增强生成、受限生成和推理任务

大型语言模型

Transformers 支持多种语言

Cadet-Tiny是一个基于SODA数据集训练的超小型对话模型，专为边缘设备推理设计，体积仅为Cosmo-3B模型的2%左右。

Transformers 英语

Roberta Base Chinese Extractive Qa

基于RoBERTa架构的中文抽取式问答模型，适用于从给定文本中提取答案的任务。

问答系统中文

AIbase

智启未来，您的人工智能解决方案智库

简体中文

© 2025AIbase 备案号：闽ICP备08105208号-24