W

Wav2vec2 Large Xls R 300m Kyrgyz

由 infinitejoy 开发
这是一个基于facebook/wav2vec2-xls-r-300m模型在吉尔吉斯语语音数据集上微调的自动语音识别(ASR)模型
下载量 17
发布时间 : 3/2/2022
模型介绍
内容详情
替代品

模型简介

该模型专门针对吉尔吉斯语进行优化,能够将吉尔吉斯语音频转换为文本,适用于语音转写等应用场景

模型特点

多语言支持
基于XLS-R架构,具有处理多种语言的能力
高效语音识别
在吉尔吉斯语语音识别任务上表现良好
预训练+微调架构
利用大规模预训练模型,通过特定语言数据微调获得更好性能

模型能力

吉尔吉斯语语音识别
音频转文本
语音转录

使用案例

语音转写
吉尔吉斯语语音转文字
将吉尔吉斯语的语音内容转换为可编辑的文本
词错误率(WER)40.9%,字符错误率(CER)11.0%
语音助手
吉尔吉斯语语音指令识别
用于构建支持吉尔吉斯语的语音助手系统