W

Wav2vec2 Large Xlsr Thai Tokenized

由 chompk 开发
这是一个基于Wav2Vec2-Large-XLSR-53架构的泰语自动语音识别(ASR)模型,使用Common Voice数据集进行微调,并采用deepcut分词器进行训练。
下载量 44
发布时间 : 3/2/2022
模型介绍
内容详情
替代品

模型简介

该模型专注于泰语语音识别任务,能够将泰语语音转换为文本。适用于需要泰语语音转文本的应用场景。

模型特点

基于XLSR-53架构
采用Wav2Vec2-Large-XLSR-53架构,该架构在跨语言语音识别任务中表现优异
使用deepcut分词器
专门针对泰语特点使用deepcut分词器进行训练,优化了泰语文本处理能力
Common Voice数据集微调
使用Common Voice泰语数据集进行微调,提高了对真实语音的识别能力

模型能力

泰语语音识别
语音转文本
泰语语音处理

使用案例

语音转写
泰语会议记录
将泰语会议录音自动转换为文字记录
泰语语音助手
为泰语语音助手提供语音识别能力
教育
泰语学习应用
帮助泰语学习者通过语音练习提高发音