W

Whisper Base

由 onnx-community 开发
Whisper是一个自动语音识别(ASR)系统,由OpenAI训练,支持多语言语音转录。
下载量 5,704
发布时间 : 5/24/2024
模型介绍
内容详情
替代品

模型简介

Whisper Base是Whisper系列中的基础模型,专注于高准确率的语音转文本任务,支持多种语言。

模型特点

多语言支持
能够识别和转录多种语言的语音内容
ONNX格式兼容
已转换为ONNX权重格式,确保与Transformers.js的网页端兼容性
高准确率
基于Transformer架构,提供高质量的语音识别结果

模型能力

语音转文本
多语言语音识别
实时语音转录

使用案例

语音转录
会议记录自动化
自动将会议录音转换为文字记录
提高会议记录效率,减少人工转录时间
播客字幕生成
为播客内容自动生成字幕
增强内容可访问性,扩大受众范围
语音助手
语音命令识别
识别和理解用户的语音命令
实现自然语言交互界面