中文语音识别

# 中文语音识别

Belle Whisper Large V3 Turbo Zh Ct2

这是BELLE-2/Belle-whisper-large-v3-turbo-zh模型的CTranslate2格式转换版本，适用于高效语音识别任务。

Belle Whisper Large V3 Turbo Zh

基于whisper-large-v3-turbo微调的中文语音识别模型，在多个中文语音识别基准测试中性能提升显著

Whisper Tiny Chinese

基于OpenAI Whisper Tiny模型在Common Voice 11.0中文数据集上微调的语音识别模型

Transformers 中文

Belle Whisper Large V3 Zh

基于whisper-large-v3微调优化的中文语音识别模型，在多个中文语音基准测试中性能显著提升

Belle Distilwhisper Large V2 Zh

基于distilwhisper-large-v2微调的中文语音识别模型，速度是whisper-large-v2的5.8倍，参数减少51%

Belle Whisper Large V2 Zh

基于whisper-large-v2进行微调的中文语音识别模型，在多个中文语音识别基准测试中实现了30-70%的相对性能提升。

Asr Wav2vec2 Commonvoice 14 Zh CN

这是一个基于CommonVoice中文数据集训练的端到端自动语音识别系统，使用wav2vec2.0和CTC架构，支持中文语音识别。

语音识别中文

Faster Whisper Large Zh Cv11

这是jonatasgrosman/whisper-large-zh-cv11模型的CTranslate2转换版本，用于高效语音识别任务，特别优化了中文语音识别能力。

语音识别中文

Whisper Tiny Zh

基于openai/whisper-tiny微调的中文语音识别模型，在Common Voice 11.0中文数据集上训练

Transformers 中文

Whisper Large Zh Cv11

基于openai/whisper-large-v2在中文(普通话)上使用Common Voice 11数据集微调的语音识别模型

Transformers 中文

Whisper Small Chinese Base

基于openai/whisper-small在google/fleurs cmn_hans_cn数据集上微调的中文语音识别模型

Wav2vec2 Large Chinese Zh Cn

基于XLSR-53大模型微调的中文语音识别模型，支持16kHz采样率的语音输入

Transformers 中文

Exp W2v2t Zh Cn Wavlm S596

基于microsoft/wavlm-large模型微调的中文语音识别模型，支持简体中文，使用Common Voice 7.0 (zh-CN)数据集训练。

Stt Zh Citrinet 1024 Gamma 0 25

这是一个用于中文普通话自动语音识别(ASR)的非自回归Citrinet模型，拥有约1.4亿参数，采用字符编码方案和CTC损失/解码。

语音识别中文

Wav2vec2 Large Xlsr 53 Chinese Zn Cn Aishell1

基于facebook/wav2vec2-large-xlsr-53在中文AISHELL-1数据集上微调的语音识别模型，支持中文语音识别任务。

Transformers 中文

Wav2vec2 Base MIR ST500 ASR 109

基于facebook/wav2vec2-base在MIR_ST500数据集上微调的自动语音识别模型

Wav2vec2 Large Xlsr 53 Chinese Zh Cn

基于facebook/wav2vec2-large-xlsr-53模型微调的中文语音识别模型，支持16kHz采样率的语音输入。

语音识别中文

Wav2vec2 Large Xlsr 53 Chinese Zh Cn Gpt

基于facebook/wav2vec2-large-xlsr-53在中文(zh-CN)上使用Common Voice数据集进行微调的语音识别模型

Transformers 中文

精选推荐AI模型

Llama 3 Typhoon V1.5x 8b Instruct

专为泰语设计的80亿参数指令模型，性能媲美GPT-3.5-turbo，优化了应用场景、检索增强生成、受限生成和推理任务

大型语言模型

Transformers 支持多种语言

Cadet-Tiny是一个基于SODA数据集训练的超小型对话模型，专为边缘设备推理设计，体积仅为Cosmo-3B模型的2%左右。

Transformers 英语

Roberta Base Chinese Extractive Qa

基于RoBERTa架构的中文抽取式问答模型，适用于从给定文本中提取答案的任务。

问答系统中文

AIbase

智启未来，您的人工智能解决方案智库

简体中文

© 2025AIbase 备案号：闽ICP备08105208号-24