W

Wav2vec2 Large Xlsr 53 Hk

由 voidful 开发
基于facebook/wav2vec2-large-xlsr-53在粤语(使用Common Voice数据集)上进行微调的语音识别模型
下载量 26
发布时间 : 3/2/2022
模型介绍
内容详情
替代品

模型简介

这是一个针对粤语(香港)优化的自动语音识别模型,基于Wav2Vec2架构,适用于将粤语语音转换为文本。

模型特点

粤语优化
专门针对粤语(香港)方言进行微调,提高识别准确率
基于XLSR模型
建立在强大的wav2vec2-large-xlsr-53基础上,具有优秀的语音特征提取能力
16kHz采样率支持
优化处理16kHz采样率的语音输入

模型能力

粤语语音识别
语音转文本
音频内容转录

使用案例

语音转录
粤语会议记录
将粤语会议录音自动转换为文字记录
CER 16.41
媒体内容字幕生成
为粤语视频内容自动生成字幕
语音助手
粤语语音指令识别
用于支持粤语的智能设备语音控制