W

Wav2vec2 Large Xlsr 53 English

由 Xenova 开发
基于wav2vec 2.0架构的大规模语音识别模型,支持英语语音转文本
下载量 14
发布时间 : 7/26/2023
模型介绍
内容详情
替代品

模型简介

该模型是基于Facebook的wav2vec 2.0架构开发的自动语音识别(ASR)模型,专门针对英语语音进行优化,能够将英语语音准确转换为文本。

模型特点

高精度英语识别
针对英语语音优化的模型,提供高准确率的语音转文本能力
基于wav2vec 2.0架构
采用Facebook开发的先进语音识别架构,具有强大的特征提取能力
Web兼容性
提供ONNX格式权重,便于在Web环境中部署和使用

模型能力

英语语音识别
实时语音转文本
音频文件转录

使用案例

语音转录
会议记录
将英语会议录音自动转换为文字记录
提高会议记录效率,便于后续检索和分析
播客转录
将英语播客内容转换为文本
便于内容索引和文字版发布
辅助工具
实时字幕生成
为英语视频或直播生成实时字幕
提高内容可访问性