16kHz采样率适配

# 16kHz采样率适配

Exp W2v2t Sv Se R Wav2vec2 S418

基于facebook/wav2vec2-large-robust模型微调的瑞典语自动语音识别模型，支持16kHz采样率语音输入。

Exp W2v2t It Vp Fr S821

基于facebook/wav2vec2-large-fr-voxpopuli模型微调的意大利语自动语音识别模型，使用Common Voice 7.0意大利语数据集训练

Transformers 其他

Exp W2v2t It Wavlm S895

基于microsoft/wavlm-large模型微调的意大利语自动语音识别模型，使用Common Voice 7.0意大利语数据集训练。

Transformers 其他

Wav2vec2 Large Xlsr 53 Levantine Arabic

基于facebook/wav2vec2-large-xlsr-53模型，在阿拉伯语音语料库数据集上微调的阿拉伯语语音识别模型

语音识别阿拉伯语

Wav2vec2 Large Xls Ar

基于facebook/wav2vec2-large-xlsr-53模型微调的阿拉伯语自动语音识别模型，在Common Voice阿拉伯语数据集上测试WER为52%。

Transformers 阿拉伯语

Wav2vec2 Large Xlsr Estonian

基于facebook/wav2vec2-large-xlsr-53在爱沙尼亚语Common Voice数据集上微调的自动语音识别模型

语音识别其他

Wav2vec2 Large Robust Ft Libri 960h

该模型是Facebook Wav2Vec2的微调版本，专注于语音识别任务，在多种语音数据上预训练并在Librispeech上微调，具有鲁棒性强的特点。

Transformers 英语

Wav2vec2 Large Xlsr 53 Ukrainian

基于facebook/wav2vec2-large-xlsr-53在乌克兰语上使用Common Voice数据集进行微调的自动语音识别模型

语音识别其他

Wav2vec2 Large Xlsr Arabic

针对阿拉伯语语音识别微调的Wav2Vec2-Large-XLSR-53大模型，基于Common Voice和Arabic Speech Corpus数据集训练

语音识别阿拉伯语

Wav2vec2 Large Xlsr 53 Euskera

基于facebook/wav2vec2-large-xlsr-53模型在巴斯克语（Euskera）上使用Common Voice数据集进行微调的语音识别模型。

语音识别其他

Wav2vec2 Large Xlsr Tamil

基于facebook/wav2vec2-large-xlsr-53模型微调的泰米尔语自动语音识别(ASR)模型

语音识别其他

Wav2vec2 Large Xlsr Arabic

基于facebook/wav2vec2-large-xlsr-53在阿拉伯语通用语音数据集上微调的语音识别模型

Transformers 阿拉伯语

Vakyansh Wav2vec2 Hindi Him 4200

基于Wav2Vec2架构的印地语自动语音识别模型，由Harveen Chadha开发，在4200小时标注印地语数据上微调

Transformers 其他

Wav2vec2 Base Voxpopuli Sv Swedish

基于Facebook的VoxPopuli-sv基础版模型，使用NST和Common Voice数据进行微调的瑞典语语音识别模型。

Vakyansh Wav2vec2 Tamil Tam 250

基于Wav2Vec2架构的泰米尔语自动语音识别模型，由Harveen Chadha开发，在4200小时印地语数据上微调

Transformers 其他

Vakyansh Wav2vec2 Punjabi Pam 10

基于CLSRIL-23多语言预训练模型微调的旁遮普语自动语音识别模型，支持16kHz采样率的语音输入。

Transformers 其他

精选推荐AI模型

Llama 3 Typhoon V1.5x 8b Instruct

专为泰语设计的80亿参数指令模型，性能媲美GPT-3.5-turbo，优化了应用场景、检索增强生成、受限生成和推理任务

大型语言模型

Transformers 支持多种语言

Cadet-Tiny是一个基于SODA数据集训练的超小型对话模型，专为边缘设备推理设计，体积仅为Cosmo-3B模型的2%左右。

Transformers 英语

Roberta Base Chinese Extractive Qa

基于RoBERTa架构的中文抽取式问答模型，适用于从给定文本中提取答案的任务。

问答系统中文

AIbase

智启未来，您的人工智能解决方案智库

简体中文

© 2025AIbase 备案号：闽ICP备08105208号-24