W

Wav2vec Osr

由 iamtarun 开发
为The Sound Of AI开源研究小组的语音转文本模块微调的Facebook wav2vec2模型
下载量 22
发布时间 : 3/2/2022
模型介绍
内容详情
替代品

模型简介

基于wav2vec2的语音识别模型,支持将语音转换为文本。原始模型在Librispeech 960小时语音数据上预训练和微调,适用于16kHz采样的语音输入。

模型特点

高效语音识别
在有限标记数据下仍能实现高质量的语音识别
预训练与微调结合
先在大量未标记语音数据上预训练,再在标记数据上微调
对比学习
使用潜在空间掩码和对比任务学习语音表示

模型能力

语音转文本
英语语音识别

使用案例

语音转录
会议记录
将会议录音自动转换为文字记录
语音笔记
将语音笔记转换为可搜索的文本
辅助技术
听力辅助
为听障人士提供实时语音转文字服务