低CER优化

# 低CER优化

Wav2vec2 Base Japanese Asr

基于rinna/japanese-wav2vec2-base在common_voice_11_0日语数据集上微调的语音识别模型，仅支持平假名输出

Transformers 日语

Wav2vec2 Large Chinese Zh Cn

基于XLSR-53大模型微调的中文语音识别模型，支持16kHz采样率的语音输入

Transformers 中文

Wav2vec2 Large Ru Golos

基于facebook/wav2vec2-large-xlsr-53微调的俄语语音识别模型，使用Sberdevices Golos数据集训练，支持16kHz音频输入

Transformers 其他

Wav2vec2 Xls R 300m Japanese

这是一个基于facebook/wav2vec2-xls-r-300m微调的日语自动语音识别模型，专门用于将日语音频转录为平假名文本。

Transformers 日语

Wav2vec2 Xls R 300m Korean

基于XLS-R架构的韩语自动语音识别模型，在Zeroth Korean数据集上微调

Transformers 韩语

W2v Hf Jsut Xlsr53

基于facebook/wav2vec2-large-xlsr-53模型，使用Common Voice和JSUT数据集对日语进行了微调的自动语音识别模型。

Transformers 日语

Wav2vec2 Large Xlsr Japanese

基于facebook/wav2vec2-large-xlsr-53在日语上的微调模型，支持日语语音识别任务。

Transformers 日语

Wav2vec2 Large Xlsr 53 Chinese Zh Cn

基于facebook/wav2vec2-large-xlsr-53模型微调的中文语音识别模型，支持16kHz采样率的语音输入。

语音识别中文

Wav2vec2 Xls R 300m Korean Lm

基于XLS-R架构的韩语自动语音识别模型，在Zeroth韩语数据集上微调并添加5-gram语言模型

Transformers 韩语

Wav2vec2 Large Xlsr 53 Tw Gpt

基于facebook/wav2vec2-large-xlsr-53在台湾普通话(zh-tw)上微调的语音识别模型，支持16kHz采样率语音输入

Wav2vec2 Large Xlsr 53 Finnish

基于XLSR-53大模型微调的芬兰语语音识别模型，支持16kHz音频输入

语音识别其他

Wav2vec2 Xls R 300m Zh HK Lm V2

基于XLS-R架构的自动语音识别模型，针对粤语(zh-HK)优化，在Common Voice数据集上微调并加入5-gram语言模型。

Wav2vec2 Xls R 300m German De

该模型是基于facebook/wav2vec2-xls-r-300m在MOZILLA-FOUNDATION/COMMON_VOICE_7_0 - DE数据集上微调的德语自动语音识别模型。

Transformers 德语

Wav2vec2 Xls R 300m Japanese

这是一个基于facebook/wav2vec2-xls-r-300m在日语Common Voice 8.0数据集上微调的自动语音识别(ASR)模型，支持日语语音转文字功能。

Transformers 日语

Wav2vec2 Large Japanese

基于facebook/wav2vec2-large-xlsr-53模型微调的日语语音识别模型，支持16kHz采样率输入

语音识别日语

精选推荐AI模型

Llama 3 Typhoon V1.5x 8b Instruct

专为泰语设计的80亿参数指令模型，性能媲美GPT-3.5-turbo，优化了应用场景、检索增强生成、受限生成和推理任务

大型语言模型

Transformers 支持多种语言

Cadet-Tiny是一个基于SODA数据集训练的超小型对话模型，专为边缘设备推理设计，体积仅为Cosmo-3B模型的2%左右。

Transformers 英语

Roberta Base Chinese Extractive Qa

基于RoBERTa架构的中文抽取式问答模型，适用于从给定文本中提取答案的任务。

问答系统中文

AIbase

智启未来，您的人工智能解决方案智库

简体中文

© 2025AIbase 备案号：闽ICP备08105208号-24