W

Wav2vec2 Xls R 300m Khmer

由 vitouphy 开发
这是一个基于OpenSLR数据集微调的facebook/wav2vec2-xls-r-300m模型,专门用于高棉语(km)的自动语音识别任务。
下载量 2,321
发布时间 : 3/2/2022
模型介绍
内容详情
替代品

模型简介

该模型是针对高棉语的自动语音识别系统,在有限的数据集(约4小时)上训练,表现出了不错的识别能力。

模型特点

小数据高效训练
仅使用约4小时的训练数据(实际训练时长3.2小时)就取得了不错的识别效果
语言模型支持
支持结合语言模型(kenlm)进行解码,显著提升识别准确率
轻量级部署
基于300M参数的模型,相对轻量,适合实际应用部署

模型能力

高棉语语音识别
音频转文本
语音内容分析

使用案例

语音转录
高棉语语音转文字
将高棉语语音内容转换为文字记录
WER 25.7%, CER 7.03%
语音分析
高棉语语音内容分析
分析高棉语语音中的关键词和内容