P

Personal Speech To Text Model

由 fractalego 开发
基于facebook/wav2vec2-large-robust-ft-swbd-300h模型微调的个人语音转文字模型,针对特定口音优化。
下载量 75
发布时间 : 3/2/2022
模型介绍
内容详情
替代品

模型简介

该模型是针对个人口音优化的语音识别模型,通过约1000条个人语音录音微调,能更准确地识别特定口音的语音。

模型特点

口音优化
针对特定口音进行优化,提高识别准确率。
轻量微调
仅使用约1000条个人语音录音进行微调,保持模型效率。
基于强大基础模型
基于facebook的wav2vec2-large-robust-ft-swbd-300h模型,具备强大的语音识别能力。

模型能力

语音转文字
特定口音识别

使用案例

个人使用
个人语音笔记转换
将个人语音笔记准确转换为文字
提高特定口音用户的语音识别准确率
语音指令识别
识别特定口音的语音指令
改善智能家居等设备的语音控制体验