W

Wav2vec2 Large Xlsr 53 W2V2 TATAR SMALL

由 emre 开发
该模型是基于facebook/wav2vec2-large-xlsr-53在Common Voice 8数据集上微调的鞑靼语(Tatar)自动语音识别模型,测试集WER为53.16%。
下载量 30
发布时间 : 3/2/2022
模型介绍
内容详情
替代品

模型简介

这是一个针对鞑靼语优化的自动语音识别模型,基于wav2vec2架构,在Common Voice数据集上微调。

模型特点

多语言支持
基于XLSR-53预训练模型,具有跨语言表示能力
语音识别优化
专门针对鞑靼语进行微调优化
高效训练
使用混合精度训练和梯度累积等技术提高训练效率

模型能力

鞑靼语语音转文本
语音识别
语音转录

使用案例

语音转录
鞑靼语语音转录
将鞑靼语语音内容转换为文本
WER 53.16%
语音助手
鞑靼语语音命令识别
用于鞑靼语语音助手或语音控制系统的语音识别模块