W

Wav2vec2 Large Xlsr 53 Th Cv8 Newmm

由 wannaphong 开发
该模型是基于CommonVoice V8数据集训练的泰语自动语音识别模型,采用wav2vec2-large-xlsr-53架构,使用newmm分词器并整合语言模型,显著提升了泰语语音识别准确率。
下载量 6,486
发布时间 : 6/6/2022
模型介绍
内容详情
替代品

模型简介

该模型专门针对泰语语音识别任务优化,通过结合CommonVoice V8数据集和语言模型,在词错误率(WER)和字符错误率(CER)上表现出色。

模型特点

改进的数据集
使用CommonVoice V8数据集,相比V7版本数据量更大,训练效果更优
优化的分词处理
采用newmm分词器进行预分词处理,针对泰语特性优化
语言模型整合
结合语言模型进一步提升识别准确率
多指标评估
同时评估词错误率(WER)和字符错误率(CER),全面衡量模型性能

模型能力

泰语语音识别
语音转文本
多指标性能评估

使用案例

语音转写
泰语语音转录
将泰语语音内容转换为文本
在CommonVoice V8测试集上达到12.58% WER(newmm分词)
语音助手
泰语语音指令识别
用于泰语语音助手或智能设备的指令识别