A

Alphadelay

由 renBaikau 开发
基于facebook/wav2vec2-base微调的语音识别模型,词错误率(WER)为1.0
下载量 17
发布时间 : 3/2/2022

模型简介

该模型是基于facebook/wav2vec2-base架构微调的语音识别(ASR)模型,适用于将语音转换为文本的任务。

模型特点

基于wav2vec2架构
采用经过验证的wav2vec2-base架构,具有良好的语音特征提取能力
微调优化
在基础模型上进行了15轮微调训练,优化了特定场景下的表现

模型能力

语音转文本
自动语音识别

使用案例

语音转录
会议记录
将会议录音自动转换为文字记录
语音笔记
将语音备忘录转换为可搜索的文本
AIbase
智启未来,您的人工智能解决方案智库
简体中文