X

Xls R Kyrgiz Cv8

由 lucio 开发
该模型是基于facebook/wav2vec2-xls-r-300m在Common Voice 8.0吉尔吉斯语数据集上微调的自动语音识别模型
下载量 16
发布时间 : 3/2/2022
模型介绍
内容详情
替代品

模型简介

针对吉尔吉斯语优化的语音识别模型,适用于从语音到文本的转换任务

模型特点

低词错误率
在测试集上达到19.01%的WER(带语言模型)
多场景适用
针对低保真度语音场景优化,适用于多种实际应用
渐进式学习
采用渐进式学习率调度策略,优化训练效果

模型能力

吉尔吉斯语语音识别
语音转文本
音频内容索引

使用案例

媒体处理
视频字幕生成
为吉尔吉斯语视频内容自动生成字幕草稿
WER 19.01%(带语言模型)
广播内容索引
对录制的吉尔吉斯语广播节目进行内容索引
CER 5.38%(带语言模型)