W

Wav2vec2 Large Xls R 1b Frisian Cv 13 Elderly

由 golesheed 开发
基于wav2vec2-large-xls-r-1b架构的弗里斯兰语语音识别模型,专门针对老年用户群体优化
下载量 23
发布时间 : 5/27/2023
模型介绍
内容详情
替代品

模型简介

该模型是wav2vec2-large-xls-r-1b架构的微调版本,专注于弗里斯兰语的自动语音识别任务,特别针对老年用户群体的语音特征进行了优化

模型特点

老年用户优化
针对老年用户群体的语音特征进行专门优化
大规模预训练
基于10亿参数的大规模wav2vec2架构
低词错误率
在验证集上达到29.77%的词错误率

模型能力

弗里斯兰语语音识别
老年人语音特征识别

使用案例

语音转写
老年人口述历史记录
用于记录和转写弗里斯兰语老年人口述的历史故事
能有效识别老年人特有的发音特征
医疗语音助手
为弗里斯兰语地区的老年患者提供语音交互的医疗辅助系统