W

Wav2vec2 Georgian Daytona

由 Temur 开发
基于facebook/wav2vec2-large-xlsr-53模型微调的格鲁吉亚语语音识别模型,在通用语音数据集上训练
下载量 19
发布时间 : 3/2/2022
模型介绍
内容详情
替代品

模型简介

这是一个针对格鲁吉亚语优化的自动语音识别(ASR)模型,能够将格鲁吉亚语音频转换为文本

模型特点

格鲁吉亚语优化
专门针对格鲁吉亚语进行微调,提高了该语言的识别准确率
基于XLSR大模型
基于facebook/wav2vec2-large-xlsr-53模型构建,继承了其强大的语音特征提取能力
16kHz采样率支持
支持16kHz采样率的语音输入,适合大多数语音应用场景

模型能力

格鲁吉亚语语音识别
音频转文本
自动语音转录

使用案例

语音转录
格鲁吉亚语语音转文字
将格鲁吉亚语语音内容转换为可编辑的文本格式
词错误率(WER)48.34%
语音助手
格鲁吉亚语语音指令识别
用于构建支持格鲁吉亚语的语音助手和控制系统