W

Wav2vec2 Large Xlsr Cnh

由 gchhablani 开发
基于facebook/wav2vec2-large-xlsr-53模型微调的哈卡钦语语音识别模型,在通用语音数据集上训练,测试WER为31.38%。
下载量 22
发布时间 : 3/2/2022

模型简介

这是一个用于哈卡钦语自动语音识别(ASR)的模型,基于Wav2Vec2 Large XLSR-53架构微调而成,能够将哈卡钦语语音转换为文本。

模型特点

基于XLSR-53架构
使用facebook的wav2vec2-large-xlsr-53作为基础模型,该架构在大规模跨语言语音表示学习方面表现优异。
低资源语言支持
专门针对哈卡钦语这种资源较少的语言进行优化,有助于保护语言多样性。
无需语言模型
可以直接使用而无需额外的语言模型,简化了部署流程。

模型能力

语音识别
哈卡钦语语音转文本
16kHz音频处理

使用案例

语音技术
哈卡钦语语音转录
将哈卡钦语语音内容自动转换为文字
词错误率(WER)31.38%
语音助手开发
为哈卡钦语用户开发语音交互应用
语言保护
少数民族语言数字化
帮助保存和数字化哈卡钦语等少数民族语言
AIbase
智启未来,您的人工智能解决方案智库
简体中文