W

Wav2vec2 Xls R 300m Cs Cv8

由 comodoro 开发
基于facebook/wav2vec2-xls-r-300m在Common Voice 8.0捷克语数据集上微调的语音识别模型
下载量 13
发布时间 : 3/2/2022
模型介绍
内容详情
替代品

模型简介

该模型是针对捷克语优化的自动语音识别(ASR)模型,基于Wav2Vec2架构,在Common Voice 8.0数据集上微调,支持16kHz采样率的语音输入。

模型特点

高性能捷克语识别
在Common Voice 8.0测试集上达到10.3%的WER和2.6%的CER
基于XLSR架构
使用facebook的wav2vec2-xls-r-300m作为基础模型,具有强大的跨语言表示能力
无需语言模型
可直接使用,无需额外语言模型支持

模型能力

捷克语语音识别
16kHz音频处理
端到端语音转文本

使用案例

语音转写
语音笔记转文字
将捷克语语音笔记转换为可编辑文本
高准确率的文本输出
语音助手
用于捷克语语音助手应用的语音识别组件
低延迟的语音理解
语音分析
语音内容分析
分析捷克语语音内容并提取关键信息
支持后续自然语言处理任务