W

Wav2vec2 Xlsr Romansh Sursilvan

由 sammy786 开发
该模型是基于facebook/wav2vec2-xls-r-1b在罗曼什语-苏塞尔瓦方言数据集上微调的自动语音识别模型,在Common Voice 8测试集上取得13.82%的词错误率(WER)。
下载量 18
发布时间 : 3/2/2022

模型简介

这是一个针对罗曼什语-苏塞尔瓦方言优化的自动语音识别模型,基于Facebook的wav2vec2-xls-r-1b架构微调而成。

模型特点

低词错误率
在罗曼什语-苏塞尔瓦方言测试集上取得13.82%的词错误率(WER)和3.02%的字错误率(CER)
基于大模型微调
基于facebook/wav2vec2-xls-r-1b大模型微调,继承了其强大的语音特征提取能力
多数据集训练
合并了Common Voice芬兰语train.tsv、dev.tsv和other.tsv等多个数据集进行训练

模型能力

罗曼什语-苏塞尔瓦方言语音识别
鲁棒语音事件检测
对话语音处理

使用案例

语音转录
罗曼什语-苏塞尔瓦方言语音转文字
将罗曼什语-苏塞尔瓦方言的语音内容转换为文字
词错误率13.82%,字错误率3.02%
语音助手
罗曼什语-苏塞尔瓦方言语音助手
支持罗曼什语-苏塞尔瓦方言的语音交互系统
AIbase
智启未来,您的人工智能解决方案智库
简体中文