W

Whisper Large V3 Ft Cv16 Mn

由 sanchit-gandhi 开发
基于OpenAI Whisper Large V3模型在Common Voice 16.0数据集上微调的语音识别模型
下载量 34
发布时间 : 1/22/2024
模型介绍
内容详情
替代品

模型简介

该模型是OpenAI Whisper Large V3的微调版本,专注于自动语音识别(ASR)任务,在Common Voice数据集上取得了35.22%的词错误率。

模型特点

高精度语音识别
在Common Voice测试集上取得35.22%的词错误率,表现优异
多语言支持
基于Whisper架构,具备处理多种语言的能力
高效微调
在基础模型上进行针对性训练,提升特定领域的识别准确率

模型能力

语音转文本
多语言语音识别
长音频处理

使用案例

语音转录
会议记录自动生成
将会议录音自动转换为文字记录
准确率约65%(基于WER指标推断)
播客字幕生成
为播客内容自动生成字幕
辅助技术
听力障碍辅助
实时语音转文字辅助听障人士