W

Whisper Large V2 Cv11 German

由 bofenghuang 开发
基于openai/whisper-large-v2在Common Voice 11.0德语数据集上微调的自动语音识别模型,支持德语语音转文字,词错误率5.76
下载量 179
发布时间 : 12/18/2022
模型介绍
内容详情
替代品

模型简介

本模型是基于whisper-large-v2在德语数据集上微调的版本,专门用于德语自动语音识别任务,能够预测大小写和标点符号。

模型特点

低词错误率
在Common Voice 11.0德语测试集上达到5.76的WER,性能优于同系列其他规模模型
标点符号预测
能够自动预测大小写和标点符号,提高转录文本的可读性
16kHz采样率支持
专为16kHz采样率的语音输入优化

模型能力

德语语音识别
语音转文字
标点符号预测

使用案例

语音转录
德语会议记录
将德语会议录音自动转录为文字记录
高准确率的转录文本,包含标点符号
德语媒体字幕生成
为德语视频或播客自动生成字幕
准确的时间对齐字幕
语音助手
德语语音指令识别
在德语语音助手中识别用户指令
高准确率的指令识别