W

Wav2vec2 Model1 Torgo

由 modhp 开发
基于facebook/wav2vec2-base微调的语音识别模型
下载量 20
发布时间 : 3/24/2022

模型简介

该模型是基于facebook/wav2vec2-base在未知数据集上微调得到的语音识别模型,主要用于语音转文本任务。

模型特点

基于wav2vec2架构
采用facebook的wav2vec2-base作为基础架构,具有优秀的语音特征提取能力
微调优化
在特定数据集上进行微调,可能针对特定语音特征或口音进行了优化
高效训练
使用混合精度训练(原生AMP)和线性学习率调度器,提高训练效率

模型能力

语音识别
语音转文本

使用案例

语音处理
语音转录
将语音内容转换为文本
语音指令识别
识别语音命令并转换为可执行指令
AIbase
智启未来,您的人工智能解决方案智库
简体中文