W

Wav2vec2 Large Slavic Parlaspeech Hr

由 classla 开发
这是一个基于斯拉夫语系预训练模型的克罗地亚语自动语音识别系统,专门针对议会语音场景优化
下载量 5,768
发布时间 : 4/28/2022
模型介绍
内容详情
替代品

模型简介

该模型基于facebook/wav2vec2-large-slavic-voxpopuli-v2预训练模型,使用300小时的克罗地亚议会语音数据集ParlaSpeech-HR v1.0微调而成,专门用于克罗地亚议会场景的语音识别任务

模型特点

斯拉夫语系预训练
基于斯拉夫语系预训练模型微调,对克罗地亚语有更好的适应性
议会语音优化
专门针对克罗地亚议会场景的语音特点进行优化
高性能指标
在测试集上达到2.22%的字符错误率和6.79%的词错误率

模型能力

克罗地亚语语音识别
议会场景语音转写
长音频处理

使用案例

政府机构
议会会议记录
自动转写克罗地亚议会会议内容
高效生成会议文字记录,准确率达93%以上
学术研究
政治语言分析
为政治学家提供议会发言的文本数据
支持大规模政治话语分析研究