W

Whisper Large V3 Turbo Common Voice 19 0 Zh TW

由 JacobLinCool 开发
基于OpenAI Whisper-large-v3-turbo微调的繁体中文(台湾)自动语音识别模型
下载量 220
发布时间 : 10/31/2024
模型介绍
内容详情
替代品

模型简介

这是一个针对繁体中文(台湾)优化的自动语音识别模型,基于Common Voice 19.0台湾中文数据集微调,支持无需提示的语音转文字任务。

模型特点

繁体中文优化
专门针对台湾地区繁体中文语音进行优化训练
大规模数据集
使用比标准Common Voice数据集大4倍的训练数据(约50k样本)
无需提示
设计为无需额外提示即可直接使用的ASR模型
继承Whisper能力
保留了原始Whisper模型的语言识别和支持多种中文变体的能力

模型能力

自动语音识别
繁体中文语音转录
语音转文字

使用案例

语音转录
会议记录
将台湾地区的中文会议录音自动转换为文字记录
词错误率32.56%,字符错误率8.60%
语音备忘录
将日常语音备忘录转换为可搜索的文字内容
无障碍应用
实时字幕生成
为台湾地区的视频内容生成实时中文字幕