W

Wav2vec2 Large Xlsr 53 Georgian

由 MehdiHosseiniMoghadam 开发
这是一个基于facebook/wav2vec2-large-xlsr-53模型微调的格鲁吉亚语自动语音识别(ASR)模型,使用Common Voice数据集进行训练。
下载量 44
发布时间 : 3/2/2022
模型介绍
内容详情
替代品

模型简介

该模型专门用于格鲁吉亚语的语音识别任务,能够将格鲁吉亚语语音转换为文本。

模型特点

格鲁吉亚语专用
专门针对格鲁吉亚语优化的语音识别模型
基于XLSR-53
基于强大的wav2vec2-large-xlsr-53模型微调
Common Voice数据集训练
使用Common Voice的格鲁吉亚语数据集进行训练

模型能力

格鲁吉亚语语音识别
音频转文本
16kHz采样率音频处理

使用案例

语音转写
格鲁吉亚语语音转录
将格鲁吉亚语语音内容转换为文本
在Common Voice测试集上WER为60.5%