W

Wav2vec2 Large Xlsr 53 Th

由 airesearch 开发
这是一个基于wav2vec2-large-xlsr-53模型在泰语通用语音7.0数据集上微调的自动语音识别(ASR)模型。
下载量 110.74k
发布时间 : 3/2/2022
模型介绍
内容详情
替代品

模型简介

该模型专门用于泰语语音识别任务,在通用语音7.0泰语数据集上进行了微调,支持多种泰语分词器。

模型特点

多分词器支持
集成了PyThaiNLP和deepcut等多种泰语分词器,提高识别准确性
高性能
在通用语音7.0测试集上取得了较低的WER(0.9524%)和CER(0.1623%)
数据清洗优化
使用专门设计的清洗规则预处理数据集,提高模型训练效果

模型能力

泰语语音识别
语音转文本
支持多种泰语分词方式

使用案例

语音转录
泰语语音转文字
将泰语语音内容转换为文本格式
在测试集上WER为0.9524%
语音助手
泰语语音指令识别
用于泰语语音助手或智能设备的指令识别