wav2vec2-large-xlsr-53-english开源语音识别模型

首页

Wav2vec2 Large Xlsr 53 English

由 Xenova 开发

基于wav2vec 2.0架构的大规模语音识别模型，支持英语语音转文本

语音识别

Transformers

#英语语音识别 #高精度转写 #ONNX优化

下载量 14

发布时间 : 7/26/2023

模型简介

该模型是基于Facebook的wav2vec 2.0架构开发的自动语音识别(ASR)模型，专门针对英语语音进行优化，能够将英语语音准确转换为文本。

模型特点

高精度英语识别

针对英语语音优化的模型，提供高准确率的语音转文本能力

基于wav2vec 2.0架构

采用Facebook开发的先进语音识别架构，具有强大的特征提取能力

Web兼容性

提供ONNX格式权重，便于在Web环境中部署和使用

模型能力

英语语音识别

实时语音转文本

音频文件转录

使用案例

语音转录

会议记录

将英语会议录音自动转换为文字记录

提高会议记录效率，便于后续检索和分析

播客转录

将英语播客内容转换为文本

便于内容索引和文字版发布

辅助工具

实时字幕生成

为英语视频或直播生成实时字幕

提高内容可访问性

属性	详情
基础模型	jonatasgrosman/wav2vec2-large-xlsr-53-english
库名称	transformers.js

精选推荐AI模型

Llama 3 Typhoon V1.5x 8b Instruct

专为泰语设计的80亿参数指令模型，性能媲美GPT-3.5-turbo，优化了应用场景、检索增强生成、受限生成和推理任务

Cadet-Tiny是一个基于SODA数据集训练的超小型对话模型，专为边缘设备推理设计，体积仅为Cosmo-3B模型的2%左右。

Roberta Base Chinese Extractive Qa

基于RoBERTa架构的中文抽取式问答模型，适用于从给定文本中提取答案的任务。

问答系统中文

uer

2,694

智启未来，您的人工智能解决方案智库

简体中文

Wav2vec2 Large Xlsr 53 English

模型简介

模型特点

模型能力

使用案例

🚀 语音识别模型

🚀 快速开始

📦 安装指南

💻 使用示例

基础用法

📚 详细文档