W

Wav2vec2 Xls R 300m Bp1 Es Eu

由 gttsehu 开发
基于facebook/wav2vec2-xls-r-300m微调的巴斯克语自动语音识别模型,在巴斯克议会数据集上取得3.67%的词错误率
下载量 49
发布时间 : 1/5/2024
模型介绍
内容详情
替代品

模型简介

这是一个针对巴斯克议会场景优化的自动语音识别模型,基于XLS-R架构,特别适用于巴斯克语的政治演讲和会议记录场景。

模型特点

低词错误率
在巴斯克议会数据集上仅3.67%的词错误率,表现优异
多GPU优化
采用4GPU分布式训练,支持高效的大规模数据处理
领域适配
专门针对政治演讲场景优化,适应议会会议的特殊词汇和表达方式

模型能力

巴斯克语语音转文本
会议记录自动生成
政治演讲识别

使用案例

政府会议记录
议会会议自动记录
自动转录巴斯克议会会议内容,生成文字记录
准确率达96.33%(WER 3.67%)
语音档案数字化
历史会议录音转录
将存储的巴斯克议会历史录音转换为可搜索文本