B

Breeze ASR 25

由 MediaTek-Research 开发
Breeze ASR 25 是一款基于 Whisper-large-v2 微调的先进自动语音识别模型,特别优化了台湾普通话和普通话-英语代码切换场景的识别能力。
下载量 10.33k
发布时间 : 6/6/2025

模型简介

Breeze ASR 25 是一款高性能的自动语音识别模型,针对台湾普通话和普通话-英语代码切换场景进行了优化,适用于自动字幕生成等任务。

模型特点

台湾普通话优化
能更精准地识别台湾普通话语音内容
代码切换支持
支持普通话-英语代码切换场景,包括句内切换和句间切换
时间对齐增强
提供更准确的时间对齐功能,适合自动字幕生成
高性能
在多个基准测试中表现优于 Whisper-large-v2

模型能力

语音识别
多语言支持
代码切换识别
时间对齐

使用案例

字幕生成
自动字幕生成
为视频内容生成准确的时间对齐字幕
相比 Whisper-large-v2 提高了识别准确率
语音转写
台湾普通话转写
准确转写台湾普通话内容
在 CommonVoice16 - zh - TW 数据集上 WERR 降低 19%
代码切换转写
处理普通话-英语混合的语音内容
在 CSZS - zh - en 数据集上 WERR 降低 55.88%
AIbase
智启未来,您的人工智能解决方案智库
简体中文