F

Faster Whisper Base

由 Systran 开发
这是OpenAI Whisper基础模型的CTranslate2转换版本,用于高效语音识别任务。
下载量 1.1M
发布时间 : 11/23/2023
模型介绍
内容详情
替代品

模型简介

Whisper是一个自动语音识别(ASR)系统,经过训练可以处理多种语言的语音转录。此版本通过CTranslate2优化,提供更高效的推理性能。

模型特点

多语言支持
支持96种语言的语音识别
高效推理
通过CTranslate2优化,提供比原始实现更快的推理速度
FP16量化
模型权重以FP16格式保存,平衡精度和性能

模型能力

语音转文本
多语言语音识别
实时语音转录

使用案例

语音转录
会议记录
自动转录会议录音
生成准确的会议文字记录
字幕生成
为视频内容生成字幕
支持多种语言的字幕
语音助手
语音指令识别
识别用户语音指令
高准确率的指令识别