粤语语音识别

# 粤语语音识别

Whisper Large V3 Cantonese

基于Whisper v3微调的粤语自动语音识别模型，在Common Voice 17数据集上训练

Transformers 其他

Distil Whisper Small Cantonese

这是一个基于Whisper Small的粤语语音识别蒸馏模型，在Common Voice 16.0上实现了9.7的CER（无标点符号）。

Transformers 中文

Whisper Large V2 Cantonese

基于OpenAI Whisper Large V2模型微调的粤语自动语音识别(ASR)模型，在Common Voice 11.0粤语数据集上训练，字错误率(CER)为6.21%。

Transformers 其他

Whisper Large V2 Cantonese

基于OpenAI Whisper Large V2在粤语数据集上微调的自动语音识别模型，在测试集上达到6.7274%的字错误率

Transformers 其他

Whisper Small Cantonese

基于OpenAI Whisper-small微调的粤语语音识别模型，在Common Voice 16.0测试集上CER为7.93

Transformers 支持多种语言

Wav2vec2 Large Xlsr 53 Cantonese

基于facebook/wav2vec2-large-xlsr-53模型，使用Common Voice语料库8.0版对粤语进行微调的语音识别模型

Transformers 其他

Wav2vec2 Large Xlsr 53 Hk

基于facebook/wav2vec2-large-xlsr-53在粤语（使用Common Voice数据集）上进行微调的语音识别模型

Wav2vec2 Large Xls R 300m Cantonese

这是一个基于facebook/wav2vec2-xls-r-300m模型在粤语(香港)数据集上微调的自动语音识别(ASR)模型，专门用于处理粤语语音识别任务。

Transformers 中文

Wav2vec2 Xls R 300m Zh HK V2

基于XLS-R架构的粤语自动语音识别模型，在Common Voice粤语数据集上微调

Wav2vec2 Xls R 300m Zh HK Lm V2

基于XLS-R架构的自动语音识别模型，针对粤语(zh-HK)优化，在Common Voice数据集上微调并加入5-gram语言模型。

Wav2vec2 Large Xlsr Cantonese

基于Facebook的wav2vec2-large-xlsr-53模型微调的粤语语音识别模型，支持16kHz采样率的语音输入。

语音识别其他

精选推荐AI模型

Llama 3 Typhoon V1.5x 8b Instruct

专为泰语设计的80亿参数指令模型，性能媲美GPT-3.5-turbo，优化了应用场景、检索增强生成、受限生成和推理任务

大型语言模型

Transformers 支持多种语言

Cadet-Tiny是一个基于SODA数据集训练的超小型对话模型，专为边缘设备推理设计，体积仅为Cosmo-3B模型的2%左右。

Transformers 英语

Roberta Base Chinese Extractive Qa

基于RoBERTa架构的中文抽取式问答模型，适用于从给定文本中提取答案的任务。

问答系统中文

AIbase

智启未来，您的人工智能解决方案智库

简体中文

© 2025AIbase 备案号：闽ICP备08105208号-24