高精度语音转写

# 高精度语音转写

Whisper Medium Oswald

基于OpenAI Whisper-medium微调的海地克里奥尔语语音识别模型，专注高准确率转录

Transformers 其他

Exp W2v2t It Wavlm S895

基于microsoft/wavlm-large模型微调的意大利语自动语音识别模型，使用Common Voice 7.0意大利语数据集训练。

Transformers 其他

Ai Light Dance Singing2 Ft Wav2vec2 Large Xlsr 53 5gram V3

基于wav2vec2-large-xlsr-53模型微调的自动语音识别模型，专注于歌唱语音识别

Ai Light Dance Singing2 Ft Wav2vec2 Large Xlsr 53 5gram V4 1

该模型是基于wav2vec2-large-xlsr-53架构的自动语音识别(ASR)模型，在GARY109/AI_LIGHT_DANCE - ONSET-SINGING2数据集上微调得到，主要用于歌唱语音识别任务。

Ai Light Dance Stepmania Ft Wav2vec2 Large Xlsr 53 V5

基于wav2vec2-large-xlsr-53的自动语音识别模型，在GARY109/AI_LIGHT_DANCE数据集上微调

Wav2vec2 Large Xls R 300m Turkish Colab

该模型是基于facebook/wav2vec2-xls-r-300m在common_voice土耳其语数据集上微调的语音识别模型，在评估集上取得了32.08%的词错误率。

Ai Light Dance Singing Ft Pretrain Wav2vec2 Large Lv60

该模型是基于wav2vec2-large-lv60架构的自动语音识别(ASR)模型，在GARY109/AI_LIGHT_DANCE - ONSET-SINGING数据集上微调得到，主要用于歌声识别任务。

Wav2vec2 Final 1 Lm 4

基于facebook/wav2vec2-base微调的语音识别模型，在评估集上词错误率为0.4499

Wav2vec2 Large Xlsr 53 Tr Fine Tuning Deprecated

该模型是基于facebook/wav2vec2-large-xlsr-53在common_voice土耳其语数据集上微调的语音识别模型

Wav2vec2 1b Npsc Nst Bokmaal

该模型是基于facebook/wav2vec2-xls-r-1b在挪威语Bokmål方言语音数据集上微调的自动语音识别(ASR)模型

基于wav2vec2-xls-r-2b架构的亚美尼亚语自动语音识别模型，支持hy/hye语言

Transformers 其他

20220412 203254

该模型是基于facebook/wav2vec2-xls-r-300m在common_voice数据集上微调的语音识别模型，支持自动语音识别任务。

Wav2vec2 Large 100h Lv60 Self

Wav2Vec2-Large-100h-Lv60是基于100小时Libri-Light和Librispeech语音数据预训练和微调的大模型，采用自训练目标训练，适用于16kHz采样率的语音识别任务。

Transformers 英语

Wav2vec2 Large Xlsr 53 Ft Cgn

基于facebook/wav2vec2-large-xlsr-53大模型，通过CTC损失函数在荷兰语口语语料库上进行微调训练的荷兰语语音识别模型

Transformers 其他

Wav2vec2 Dutch Large Ft Cgn

一款荷兰语Wav2Vec2模型，通过在荷兰语音库CGN上对原始英文模型进行持续预训练和微调构建。

Transformers 其他

Wav2vec2 Large Xls R 300m Vietnamese Colab

该模型是基于facebook/wav2vec2-xls-r-300m在通用语音数据集上微调的越南语语音识别模型

Wav2vec2 2 Bart Large No Adapter

该模型是基于LibriSpeech ASR数据集训练的自动语音识别(ASR)模型，能够将英语语音转换为文本。

Wav2vec2 Large Xlsr 53 Levantine Arabic

基于facebook/wav2vec2-large-xlsr-53模型，在阿拉伯语音语料库数据集上微调的阿拉伯语语音识别模型

语音识别阿拉伯语

Wav2vec2 2 Bert Large No Adapter

基于LibriSpeech数据集训练的自动语音识别(ASR)模型，用于将英语语音转换为文本

Wav2vec2 Xls R 300m Turkish Tr Med

该模型是基于facebook/wav2vec2-xls-r-300m在常见语音数据集上微调的土耳其语语音识别模型

Wav2vec2 Xlsr Tatar

该模型是基于facebook/wav2vec2-xls-r-1b在鞑靼语数据集上微调得到的自动语音识别模型，在Common Voice 8数据集上取得了16.87%的词错误率(WER)。

Transformers 其他

Wav2vec2 Large Xlsr Persian V2

基于facebook/wav2vec2-large-xlsr-53在波斯语（波斯语）上使用Common Voice数据集进行微调的自动语音识别模型

语音识别其他

Wav2vec2 2 Bert Large No Adapter Frozen Enc

该模型是基于librispeech_asr数据集训练的语音识别模型，在评估集上取得了2.0133的词错误率(WER)。

Wav2vec2 Large Xls R 300m Turkish Colab

该模型是基于facebook/wav2vec2-xls-r-300m在common_voice数据集上微调的土耳其语语音识别模型。

Wav2vec2 Large It Voxpopuli

基于VoxPopuli意大利语无标注数据预训练的语音识别模型，采用Facebook的Wav2Vec2架构

语音识别其他

Wav2vec2 Common Voice Tr Demo

这是一个基于facebook/wav2vec2-large-xlsr-53模型在COMMON_VOICE - TR土耳其语数据集上微调的自动语音识别(ASR)模型。

Transformers 其他

Wav2vec2 Large Xlsr Persian Shemo

基于Wav2Vec2-Large-XLSR-53在波斯语ShEMO数据集上微调的自动语音识别模型

语音识别其他

Wav2vec2 Xlsr Chuvash

该模型是基于facebook/wav2vec2-xls-r-1b在Common Voice 8楚瓦什语数据集上微调的自动语音识别模型

Transformers 其他

Wav2vec2 Large Xlsr 53 Esperanto

这是一个基于Facebook的wav2vec2-large-xlsr-53模型微调的世界语(Esperanto)语音识别模型，使用Common Voice数据集训练。

语音识别其他

基于facebook/wav2vec2-large模型，使用Common Voice数据集进行英语微调的语音识别模型，支持16kHz采样率的语音输入。

Wav2vec2 Large Xlsr 53 French

这是一个基于wav2vec2架构的自动语音识别(ASR)模型，专门针对法语进行了微调，在Common Voice法语测试集上取得了12.82%的词错误率(WER)。

Transformers 法语

这是一个基于facebook/wav2vec2-xls-r-300m模型在卡拜尔语数据集上微调的自动语音识别(ASR)模型

Transformers 其他

精选推荐AI模型

Llama 3 Typhoon V1.5x 8b Instruct

专为泰语设计的80亿参数指令模型，性能媲美GPT-3.5-turbo，优化了应用场景、检索增强生成、受限生成和推理任务

大型语言模型

Transformers 支持多种语言

Cadet-Tiny是一个基于SODA数据集训练的超小型对话模型，专为边缘设备推理设计，体积仅为Cosmo-3B模型的2%左右。

Transformers 英语

Roberta Base Chinese Extractive Qa

基于RoBERTa架构的中文抽取式问答模型，适用于从给定文本中提取答案的任务。

问答系统中文

AIbase

智启未来，您的人工智能解决方案智库

简体中文

© 2025AIbase 备案号：闽ICP备08105208号-24