语音识别

# 语音识别

Ultravox V0 5 Llama 3 2 1b GGUF

Ultravox v0.5是基于Llama-3 2.1B架构优化的音频文本转文本模型，专注于高效处理语音转写任务。

Wav2vec2 Base Librispeech Demo Colab

该模型是基于facebook/wav2vec2-base在LibriSpeech数据集上微调的语音识别模型，在评估集上取得了0.3174的词错误率。

Hubert Base Librispeech Demo Colab

基于facebook/hubert-large-ls960-ft微调的语音识别模型，在LibriSpeech数据集上训练

Wav2vec Checkpoints

基于facebook/wav2vec2-base微调的语音处理模型，在评估集上准确率达99.48%

Zeyadd-Mostaffa

Deepfake Audio Detection

基于wav2vec2-base-finetuned进一步微调的语音处理模型，在评估集上准确率达98.82%

Deepfake Audio Detection

基于wav2vec2-base-finetuned模型微调的语音处理模型，在评估集上准确率达98.82%

Wav2vec2 Phoneme

基于facebook/wav2vec2-large-xlsr-53微调的语音识别模型，专注于音素识别任务

Wav2vec2 Base Finetuned

基于facebook/wav2vec2-base模型微调的语音处理模型，在评估集上准确率达99.97%

Wav2vec2 Base Finetuned

基于facebook/wav2vec2-base模型微调的语音处理模型，在评估集上达到99.97%的准确率

Wav2vec2 Base Finetuned Ks

基于wav2vec2-base模型在音频文件夹数据集上微调的音频分类模型，验证集准确率达99.82%

Whisper Small Dialect Classifier Cross

该模型是基于whisper-small架构的方言分类器，用于识别和分类特定方言的语音输入。

Bsc Ai Thesis Torgo Model 1

基于facebook/wav2vec2-base微调的语音处理模型，在评估集上表现出色

Neunit Ks Kangyuan0601

该模型是基于facebook/wav2vec2-base在superb数据集上微调的音频分类模型，在评估集上取得了99.87%的准确率。

Wav2vec2 Base Finetuned Amd

该模型是基于facebook/wav2vec2-base在未知数据集上微调的版本，主要用于语音识别任务，在评估集上达到84.55%的准确率。

Audio Class Finetuned

该模型是基于facebook/wav2vec2-base在superb数据集上微调的音频分类模型，在评估集上取得了0.6578的准确率。

Wav2vec2 Base Finetuned Ks

基于facebook/wav2vec2-base在superb数据集上微调的语音识别模型，准确率达98.34%

Whisper Small ISSAI KSC 335RS V2

基于Whisper架构的小型语音识别模型，适用于特定领域的语音转文本任务

该模型是基于facebook/wav2vec2-xls-r-300m微调的语音识别模型，主要用于英语语音转文本任务。

Wav2vec2 Base Finetuned Ks

该模型是基于facebook/wav2vec2-base在superb数据集上微调的语音识别模型，在关键词识别任务上表现出色。

Wav2vec2 Base Finetuned Ie

基于facebook/wav2vec2-base模型微调的版本，用于特定任务

Wav2vec2 Base Finetuned Ks

基于facebook/wav2vec2-base模型微调的语音识别模型，在评估集上准确率达到87.27%。

Wav2vec2 Base Timit Demo Google Colab

该模型是基于facebook/wav2vec2-base在TIMIT数据集上微调的语音识别模型，在Google Colab环境下训练完成。

Wav2vec2 Base Timit Demo Google Colab

该模型是基于facebook/wav2vec2-base的微调版本，主要用于语音识别任务。

Wav2vec2 Base Timit Demo Google Colab

基于facebook/wav2vec2-base模型在TIMIT数据集上微调的语音识别模型

Wav2vec2 Base Timit Demo Colab

基于facebook/wav2vec2-base模型在TIMIT数据集上微调的语音识别模型，具有较低的词错误率(WER)。

Wav2vec2 Base Timit Demo Google Colab

基于facebook/wav2vec2-base在TIMIT数据集上微调的语音识别模型，专注于英语语音转文字任务

Wav2vec2 Base Timit Demo Google Colab

该模型是基于facebook/wav2vec2-base在TIMIT数据集上微调得到的语音识别模型，主要用于英语语音转文本任务。

Wav2vec2 Base Ft Cv3 V3

该模型是基于facebook/wav2vec2-base在Common Voice 3.0英语数据集上微调的语音识别模型，在测试集上取得了0.247的词错误率。

Wav2vec Trained

该模型是基于facebook/wav2vec2-base微调而成的语音识别模型，在评估集上取得了词错误率0.1042的表现。

基于facebook/wav2vec2-base-960h微调的语音识别模型

基于facebook/wav2vec2-base-960h微调的语音识别模型，在评估集上词错误率为1.0

基于facebook/wav2vec2-base微调的语音识别模型，在评估集上取得了0.3355的词错误率(WER)。

Wav2vec2 Base Dataset Asr Demo Colab

这是一个基于distilhubert在superb数据集上微调的语音识别模型，主要用于自动语音识别(ASR)任务。

Test Demo Colab

这是一个自动生成的测试模型，主要用于演示和实验目的。

大型语言模型

Wav2vec2 Base Timit Demo Google Colab

该模型是基于facebook/wav2vec2-base在TIMIT数据集上微调的语音识别模型，在评估集上取得了0.3384的词错误率(WER)。

Wav2vec2 Keyword Spotting Int8

基于wav2vec2架构的语音关键词检测模型，已通过Optimum OpenVINO进行量化优化

Wac2vec Lllfantomlll

基于facebook/wav2vec2-base微调的语音识别模型，在评估集上取得了0.3417的词错误率。

Wav2vec2 Base Vios Commonvoice 1

该模型是基于facebook/wav2vec2-xls-r-300m在Common Voice数据集上微调的语音识别模型，支持自动语音识别任务。

Wav2vec2 Base Timit Demo Colab53

基于facebook/wav2vec2-base模型微调的语音识别模型，适用于TIMIT数据集

Wav2vec2 Final 1 Lm 4

基于facebook/wav2vec2-base微调的语音识别模型，在评估集上词错误率为0.4499

精选推荐AI模型

Llama 3 Typhoon V1.5x 8b Instruct

专为泰语设计的80亿参数指令模型，性能媲美GPT-3.5-turbo，优化了应用场景、检索增强生成、受限生成和推理任务

大型语言模型

Transformers 支持多种语言

Cadet-Tiny是一个基于SODA数据集训练的超小型对话模型，专为边缘设备推理设计，体积仅为Cosmo-3B模型的2%左右。

Transformers 英语

Roberta Base Chinese Extractive Qa

基于RoBERTa架构的中文抽取式问答模型，适用于从给定文本中提取答案的任务。

问答系统中文

AIbase

智启未来，您的人工智能解决方案智库

简体中文

© 2025AIbase 备案号：闽ICP备08105208号-24