E

Exp W2v2t En Unispeech Sat S459

由 jonatasgrosman 开发
基于微软UniSpeech-SAT-Large模型微调的英语语音识别模型,支持16kHz采样率的语音输入。
下载量 22
发布时间 : 7/8/2022
模型介绍
内容详情
替代品

模型简介

该模型是基于microsoft/unispeech-sat-large架构,在Common Voice 7.0英语数据集上微调的自动语音识别(ASR)模型,专门用于英语语音转文本任务。

模型特点

高质量语音识别
基于微软UniSpeech-SAT-Large模型微调,提供高质量的英语语音识别能力
16kHz采样率支持
专门优化支持16kHz采样率的语音输入
开源许可
采用Apache-2.0许可证,允许商业和研究使用

模型能力

英语语音识别
语音转文本

使用案例

语音转录
会议记录转录
将英语会议录音自动转换为文字记录
播客字幕生成
为英语播客内容自动生成字幕
语音助手
语音命令识别
用于英语语音助手系统的命令识别