W

Wav2vec2 Large Xlsr 53 Th Cv8 Deepcut

由 wannaphong 开发
该模型是基于CommonVoice V8数据集训练的泰语自动语音识别模型,结合了deepcut分词器和语言模型以提高识别准确率。
下载量 504
发布时间 : 6/7/2022
模型介绍
内容详情
替代品

模型简介

该模型使用泰语CommonVoice V8数据集对wav2vec2-large-xlsr-53进行微调,专门用于泰语语音识别任务,支持deepcut分词器并整合了语言模型以提高性能。

模型特点

结合语言模型
整合语言模型显著提高了识别准确率,在测试集上WER降低约3%。
支持多种分词器
支持deepcut和newmm两种泰语分词器,可根据需求选择最佳分词方式。
多数据集训练
结合CommonVoice V7和V8数据集进行训练,提高了模型泛化能力。

模型能力

泰语语音识别
支持多种分词方式
高准确率语音转文本

使用案例

语音转写
泰语语音转录
将泰语语音内容转换为文本
在CommonVoice V8测试集上达到9.61% WER
语音助手
泰语语音指令识别
用于泰语语音助手的指令识别系统