W

Wav2vec2 Xl 960h Dementiabank

由 shields 开发
该模型是基于facebook/wav2vec2-large-960h在DementiaBank数据集上微调的语音识别模型,主要用于语音转文本任务。
下载量 20
发布时间 : 3/2/2022
模型介绍
内容详情
替代品

模型简介

这是一个基于wav2vec2架构的语音识别模型,经过微调后可能特别适用于老年痴呆症患者的语音识别场景。

模型特点

高精度语音识别
基于wav2vec2-xl架构,提供高质量的语音转文本能力
特定领域微调
在DementiaBank数据集上微调,可能更适合识别老年痴呆症患者的语音特征
预训练基础
基于facebook/wav2vec2-large-960h预训练模型,具有强大的语音理解能力

模型能力

英语语音识别
语音转文本
特定人群语音识别

使用案例

医疗健康
老年痴呆症患者语音分析
用于识别和分析老年痴呆症患者的语音特征
语音转录
医疗访谈记录
将医生与患者的对话自动转录为文字