16kHz采样

# 16kHz采样

Whisper Small Cv11 French

基于openai/whisper-small微调的法语自动语音识别模型，训练数据为Common Voice 11.0法语数据集，支持大小写和标点符号预测。

Transformers 法语

Whisper Small Cv11 German

基于openai/whisper-small在Common Voice 11.0德语数据集上微调的语音识别模型，支持德语语音转文字并预测大小写和标点符号。

Transformers 德语

Sepformer Wham16k Enhancement

这是一个使用SepFormer架构的语音增强模型，专门用于去除音频中的噪声和混响，在WHAM!数据集上以16kHz采样频率训练。

音频增强英语

Viwav2vec2 Base 1.5k

该模型通过1.5千小时越南语语音数据预训练得到，适用于越南语语音识别任务，需微调后使用。

Transformers 其他

Hubert Large Ls960 Ft

HuBERT-Large是基于LibriSpeech 960小时语音数据微调的自监督语音表示学习模型，用于自动语音识别任务。

Transformers 英语

Wav2vec2 Large Pitch Recognition

基于facebook/wav2vec2-large-xlsr-53在日语口音数据集上微调的语音识别模型

Transformers 日语

Wav2vec2 Large Xlsr 53 French

基于facebook/wav2vec2-large-xlsr-53在Common Voice法语数据集上微调的自动语音识别模型，测试WER为34.86%。

语音识别法语

MehdiHosseiniMoghadam

精选推荐AI模型

Llama 3 Typhoon V1.5x 8b Instruct

专为泰语设计的80亿参数指令模型，性能媲美GPT-3.5-turbo，优化了应用场景、检索增强生成、受限生成和推理任务

大型语言模型

Transformers 支持多种语言

Cadet-Tiny是一个基于SODA数据集训练的超小型对话模型，专为边缘设备推理设计，体积仅为Cosmo-3B模型的2%左右。

Transformers 英语

Roberta Base Chinese Extractive Qa

基于RoBERTa架构的中文抽取式问答模型，适用于从给定文本中提取答案的任务。

问答系统中文

AIbase

智启未来，您的人工智能解决方案智库

简体中文

© 2025AIbase 备案号：闽ICP备08105208号-24