W

Wav2vec2 Xls R Phoneme 300m Tr

由 patrickvonplaten 开发
基于Facebook的wav2vec2-xls-r-300m模型在土耳其语Common Voice数据集上微调的自动语音识别模型
下载量 16
发布时间 : 3/2/2022
模型介绍
内容详情
替代品

模型简介

该模型是针对土耳其语优化的自动语音识别(ASR)模型,专注于音素级别的识别任务。在Common Voice土耳其语评估集上取得了16.64%的音素错误率(PER)。

模型特点

音素级别识别
专注于音素级别的语音识别,适合需要精细语音分析的应用场景
土耳其语优化
专门针对土耳其语进行微调,在Common Voice土耳其语数据集上表现良好
基于XLS-R架构
采用Facebook强大的wav2vec2-xls-r-300m架构作为基础模型

模型能力

土耳其语语音识别
音素级别分析
语音转文本

使用案例

语音转录
土耳其语语音转文字
将土耳其语语音内容转换为文本
音素错误率16.64%
语音分析
音素研究
用于语言学研究和土耳其语音素分析