W

Wav2vec2 Large Xls R 300m Turkish Colab

由 Khalsuu 开发
该模型是基于facebook/wav2vec2-xls-r-300m在common_voice土耳其语数据集上微调的语音识别模型,在评估集上取得了0.3907的词错误率。
下载量 22
发布时间 : 3/24/2022
模型介绍
内容详情
替代品

模型简介

这是一个针对土耳其语优化的自动语音识别(ASR)模型,基于Facebook的wav2vec2-xls-r-300m架构微调而成。

模型特点

土耳其语优化
专门针对土耳其语进行微调,提高了对土耳其语语音的识别准确率
基于大模型微调
基于Facebook的3亿参数wav2vec2-xls-r大模型进行微调,继承了其强大的语音特征提取能力
相对较低词错误率
在评估集上取得了0.3907的词错误率,表现良好

模型能力

土耳其语语音识别
语音转文本
音频内容转录

使用案例

语音转录
土耳其语会议记录
将土耳其语会议录音自动转录为文字记录
词错误率约39%
语音助手
用于土耳其语语音助手应用的语音识别模块
教育
语言学习应用
帮助土耳其语学习者检查发音准确性