psst-base-rep开源语音识别模型 - 免费部署实现精准语音识别

首页

Psst Base Rep

由 birgermoell 开发

基于Wav2vec2-small架构在PSST数据集上训练的语音识别基线模型

语音识别

Transformers

#低FER语音识别 #音素级错误检测 #学术场景适用

下载量 30

发布时间 : 4/1/2022

模型简介

该模型是Wav2vec2-small架构在PSST数据集上的复现版本，主要用于语音识别任务，支持音素和字级别的识别。

模型特点

高效语音识别

基于Wav2vec2-small架构，提供高效的语音识别能力。

音素和字级别识别

支持音素错误率(PER)和字错误率(FER)的评估。

模型能力

语音识别

音素识别

字级别识别

使用案例

语音转写

语音转文字

将语音内容转换为文字，适用于会议记录、语音笔记等场景。

字错误率(FER): 10.4%

语音分析

音素分析

分析语音中的音素组成，适用于语音学研究或语音训练。

音素错误率(PER): 23.1%

属性	详情
模型类型	在PSST数据集上使用Wav2vec2-small训练的复现基线模型
评估指标	在`valid`分割集上，FER为10.4%，PER为23.1%

精选推荐AI模型

Llama 3 Typhoon V1.5x 8b Instruct

专为泰语设计的80亿参数指令模型，性能媲美GPT-3.5-turbo，优化了应用场景、检索增强生成、受限生成和推理任务

Cadet-Tiny是一个基于SODA数据集训练的超小型对话模型，专为边缘设备推理设计，体积仅为Cosmo-3B模型的2%左右。

Roberta Base Chinese Extractive Qa

基于RoBERTa架构的中文抽取式问答模型，适用于从给定文本中提取答案的任务。

问答系统中文

uer

2,694

智启未来，您的人工智能解决方案智库

简体中文

Psst Base Rep

模型简介

模型特点

模型能力

使用案例

🚀 语音识别模型

📚 详细文档