W

Wav2vec2 From Scratch Finetune Dummy

由 inergi 开发
这是一个基于XLSR Wav2Vec2架构的印度尼西亚语自动语音识别模型,由cahya开发并在通用语音印度尼西亚语数据集上微调。
下载量 15
发布时间 : 3/2/2022

模型简介

该模型专门用于印度尼西亚语的自动语音识别任务,能够将印度尼西亚语语音转换为文本。

模型特点

XLSR微调
基于XLSR Wav2Vec2架构进行微调,优化了印度尼西亚语的识别性能
低词错误率
在通用语音印度尼西亚语测试集上达到25.86%的词错误率(WER)
多语言基础
基于跨语言语音表示学习(XLSR)的预训练模型,具有良好的语音特征提取能力

模型能力

印度尼西亚语语音识别
语音转文本

使用案例

语音转录
会议记录
将印度尼西亚语的会议录音自动转录为文字记录
准确率约74.14%(基于WER指标)
语音助手
为印度尼西亚语语音助手提供语音识别能力
教育
语言学习应用
帮助学习者练习印度尼西亚语发音和听力
AIbase
智启未来,您的人工智能解决方案智库
简体中文