V

V1 Speech Processing Project Wav2vec2

由 Raffay 开发
该模型是基于wav2vec2-large-xls-r-300m-Urdu微调的语音处理模型,主要用于乌尔都语语音识别任务。
下载量 23
发布时间 : 4/24/2022
模型介绍
内容详情
替代品

模型简介

基于wav2vec2架构的乌尔都语语音识别模型,适用于语音转文本任务。

模型特点

乌尔都语优化
专门针对乌尔都语语音特征进行微调优化
大模型架构
基于3亿参数的大规模wav2vec2架构
高效训练
使用混合精度训练和线性学习率调度器优化训练效率

模型能力

乌尔都语语音识别
语音转文本

使用案例

语音转录
乌尔都语语音转录
将乌尔都语语音内容转换为文本