W

Wav2vec2 Base Timit Demo Google Colab

由 BitanBiswas 开发
基于facebook/wav2vec2-base在TIMIT数据集上微调的语音识别模型,适用于英语语音转文本任务
下载量 28
发布时间 : 5/14/2022

模型简介

该模型是wav2vec2-base的微调版本,专门用于英语语音识别任务,在TIMIT数据集上训练,能够将英语语音转换为文本

模型特点

高效语音识别
基于wav2vec2架构,提供高效的英语语音识别能力
微调优化
在TIMIT数据集上进行专门微调,提高了识别准确率
轻量级模型
基于wav2vec2-base架构,相对轻量但性能良好

模型能力

英语语音识别
语音转文本
自动语音转录

使用案例

语音转录
会议记录
将英语会议录音自动转换为文字记录
词错误率(WER)为0.3360
语音笔记
将英语语音笔记转换为可搜索的文本
AIbase
智启未来,您的人工智能解决方案智库
简体中文