E

Erax WoW Turbo V1.1 CT2

由 erax-ai 开发
基于CTranslate2优化的Whisper Large-v3 Turbo越南语增强本地化版,支持多语言语音识别,速度快、准确度高
下载量 1,283
发布时间 : 3/31/2025
模型介绍
内容详情
替代品

模型简介

这是一个优化的语音转文本模型,基于Whisper Large-v3 Turbo架构,特别针对越南语进行了增强,同时支持多种语言。模型经过CTranslate2优化,提供极速转录能力。

模型特点

极速转录
处理30秒音频仅需约350毫秒,支持实时转录
多语言支持
支持11种语言,特别针对越南语8种地区口音优化
高准确度
在主要语言中词错率(WER)约为12%,能处理各种口音
CTranslate2优化
通过CTranslate2库实现2.5倍加速,适合低延迟应用

模型能力

语音转文本
多语言识别
实时转录
口音适应

使用案例

实时转录
会议记录
实时转录会议内容
几乎实时的文字记录
采访记录
自动转录采访音频
快速准确的采访记录
无障碍工具
听力辅助
为听力障碍人士提供实时字幕
提高沟通可及性
媒体制作
视频字幕
自动为视频生成字幕
快速准确的字幕生成