Mandarin开源普通话语音识别模型 - 免费部署精准识别普通话语音

首页

Mandarin

由 GleamEyeBeast 开发

这是一个基于wav2vec2-large-xlsr-53模型在common_voice数据集上微调的普通话语音识别模型

语音识别

Transformers

开源协议:Apache-2.0 #语音识别 #普通话优化 #wav2vec2微调

下载量 25

发布时间 : 3/2/2022

模型简介

该模型主要用于普通话语音识别任务，基于Facebook的wav2vec2架构进行微调

模型特点

基于wav2vec2架构

采用Facebook的wav2vec2-large-xlsr-53架构，具有良好的语音识别基础

普通话优化

专门针对普通话语音特点进行微调

开源许可

使用Apache 2.0许可证，允许商业和研究使用

模型能力

普通话语音识别

音频转文本

使用案例

语音转写

普通话语音转文字

将普通话语音内容转换为文本

语音助手

普通话语音交互

可用于构建普通话语音助手

属性	详情
模型名称	普通话语音模型
基础模型	facebook/wav2vec2-large-xlsr-53
微调数据集	通用语音（common_voice）
许可证	Apache-2.0

精选推荐AI模型

Llama 3 Typhoon V1.5x 8b Instruct

专为泰语设计的80亿参数指令模型，性能媲美GPT-3.5-turbo，优化了应用场景、检索增强生成、受限生成和推理任务

Cadet-Tiny是一个基于SODA数据集训练的超小型对话模型，专为边缘设备推理设计，体积仅为Cosmo-3B模型的2%左右。

Roberta Base Chinese Extractive Qa

基于RoBERTa架构的中文抽取式问答模型，适用于从给定文本中提取答案的任务。

问答系统中文

uer

2,694

智启未来，您的人工智能解决方案智库

简体中文

Mandarin

模型简介

模型特点

模型能力

使用案例

🚀 普通话语音模型

🚀 快速开始

📄 许可证

🔧 技术细节

训练超参数

框架版本

📚 详细文档

模型信息