英语语音处理

# 英语语音处理

Huihui Gemma 3n E4B It Abliterated GGUF

这是一个基于Gemma模型的静态量化版本，适用于自动语音识别、自动语音翻译等多种任务。

大型语言模型

Transformers 英语

Wav2vec2 Base Librispeech Demo Colab

该模型是基于facebook/wav2vec2-base在LibriSpeech数据集上微调的语音识别模型，在评估集上取得了0.3174的词错误率。

Distil Large V3.5 ONNX

Distil-Whisper是OpenAI Whisper-Large-v3的知识蒸馏版本，提供更优的性能表现和高效性。

Transformers 英语

Ichigo Llama3.1 S Instruct V0.3 Phase 3

Ichigo-llama3s是一个支持音频和文本输入的大语言模型系列，专注于提升声音理解能力和用户交互体验。

文本生成音频英语

WhisperNER是一种能够同时进行语音转录和实体识别的新颖模型，支持开放类型的命名实体识别（NER）。

语音识别支持多种语言

Phoneme Scorer V2 Wav2vec2

基于Wav2Vec2-Base架构的自动语音识别模型，专门用于音素识别，在LJSpeech Phonemes数据集上微调

Transformers 英语

ct-vikramanantha

Wav2vec2 Large Lv60 Phoneme Timit English Timit 4k Simplified

基于facebook/wav2vec2-large-lv60在TIMIT数据集上微调的语音识别模型，专注于音素识别任务。

Transformers 英语

Wav2vec2 Large Lv60 Phoneme Timit English Timit 4k

基于facebook/wav2vec2-large-lv60微调的英语音素识别模型，在TIMIT数据集上取得10.53%的音素错误率

Transformers 英语

Wav2vec2 Large Lv60 Phoneme Timit English Timit 4k 002

基于facebook/wav2vec2-large-lv60在TIMIT数据集上微调的英语音素识别模型，音素错误率10.53%

Transformers 英语

Gazelle v0.2 是由 Tincans 发布的联合语音-语言模型，支持英语。

文本生成音频

Transformers 英语

Wav2vec2 Large Xlsr 53 English Finetuned Ravdess

基于wav2vec2-large-xlsr-53-english模型在RAVDESS数据集上微调的语音情感识别模型

Wav2vec2 Lg Xlsr En Speech Emotion Recognition Finetuned Ravdess V8

基于wav2vec2架构的英语语音情感识别模型，在RAVDESS数据集上微调

Wav2vec2 Base Speech Emotion Recognition

基于facebook/wav2vec2-base微调的语音情感识别模型，用于预测音频样本中说话者的情感。

Transformers 英语

Wav2vec2 Ljspeech Gruut

基于Wav2Vec2架构的音素识别模型，在LJSpeech Phonemes数据集上微调，用于将语音转换为音素序列

Transformers 英语

Wav2vec2 Large 960h Intent Classification Ori

基于facebook/wav2vec2-large-960h微调的意图分类模型，在评估集上准确率达77.08%

MuhammadIqbalBazmi

Wav2vec2 Large Tedlium

基于TEDLIUM语料库微调的Wav2Vec2大型语音识别模型，支持英语语音转文本

语音识别英语

Wav2vec2 Base Timit Demo Google Colab

该模型是基于facebook/wav2vec2-base在TIMIT数据集上微调的语音识别模型，在Google Colab环境下训练完成。

Wav2vec2 Base Timit Demo Colab

基于facebook/wav2vec2-base模型在TIMIT数据集上微调的语音识别模型，具有较低的词错误率(WER)。

Wav2vec2 Base Timit Demo Google Colab

基于facebook/wav2vec2-base在TIMIT数据集上微调的语音识别模型，专注于英语语音转文字任务

基于facebook/wav2vec2-base-960h微调的语音识别模型

基于facebook/wav2vec2-base-960h微调的语音识别模型，在评估集上词错误率为1.0

Wav2vec2 Base Dataset Asr Demo Colab

这是一个基于distilhubert在superb数据集上微调的语音识别模型，主要用于自动语音识别(ASR)任务。

Wav2vec2 Base Timit Demo Google Colab

该模型是基于facebook/wav2vec2-base在TIMIT数据集上微调的语音识别模型，在评估集上取得了0.3384的词错误率(WER)。

Assignment1 Francesco

基于语音到文本转换器(S2T)训练的自动语音识别(ASR)模型，专为英语语音识别设计

Transformers 英语

Classroom-workshop

基于facebook/wav2vec2-base微调的语音识别模型，支持自动语音转文字任务

基于facebook/wav2vec2-xls-r-300m在librispeech_asr数据集上微调的英语语音识别模型

Wav2vec2 Base Timit Demo Google Colab

该模型是基于facebook/wav2vec2-base在TIMIT数据集上微调的语音识别模型，专注于英语语音转文字任务。

Wav2vec2 Base Timit Google Colab

基于facebook/wav2vec2-base在空数据集上微调的语音识别模型，在评估集上取得了0.3355的词错误率(WER)。

该模型是基于facebook/wav2vec2-base微调的语音识别模型，在评估集上取得了0.52的词错误率。

该模型是基于facebook/wav2vec2-base-960h微调的语音识别模型，在评估集上词错误率(WER)为1.0。

Wav2vec2 Base Timit Demo Google Colab

基于facebook/wav2vec2-base在TIMIT数据集上微调的语音识别模型，适用于英语语音转文本任务

Wav2vec2 Base Timit Demo Google Colab

该模型是基于facebook/wav2vec2-base在TIMIT数据集上微调的语音识别模型，主要用于英语语音转文字任务。

patrickvonplaten

Wav2vec2 Base Timit Demo Colab92

基于facebook/wav2vec2-base模型在TIMIT数据集上微调的语音识别模型

Wav2vec2 Base Timit Demo Colab90

基于facebook/wav2vec2-base模型在TIMIT数据集上微调的语音识别模型，专注于英语语音转文本任务

Wav2vec2 Base Timit Demo Colab11

该模型是基于facebook/wav2vec2-base进行微调的语音识别模型，在TIMIT数据集上取得了0.4348的词错误率。

Wav2vec2 Base Timit Demo Colab 1

该模型是基于facebook/wav2vec2-base微调的语音识别模型，在TIMIT数据集上训练，词错误率(WER)为0.4398。

Wav2vec2 Base Timit Demo Colab2

该模型是基于facebook/wav2vec2-base微调得到的语音识别模型，在评估集上取得了0.5664的词错误率(WER)。

Wav2vec2 Base Timit Ali Hasan Colab EX2

基于facebook/wav2vec2-base微调的语音识别模型，在TIMIT数据集上训练，评估集WER为0.4458

Wav2vec2 Base Timit Ali Hasan Colab

基于facebook/wav2vec2-base微调的语音识别模型，在TIMIT数据集上训练

Wav2vec2 Base Timit Moaiz Exp2

基于facebook/wav2vec2-base模型在TIMIT数据集上微调的语音识别模型

精选推荐AI模型

Llama 3 Typhoon V1.5x 8b Instruct

专为泰语设计的80亿参数指令模型，性能媲美GPT-3.5-turbo，优化了应用场景、检索增强生成、受限生成和推理任务

大型语言模型

Transformers 支持多种语言

Cadet-Tiny是一个基于SODA数据集训练的超小型对话模型，专为边缘设备推理设计，体积仅为Cosmo-3B模型的2%左右。

Transformers 英语

Roberta Base Chinese Extractive Qa

基于RoBERTa架构的中文抽取式问答模型，适用于从给定文本中提取答案的任务。

问答系统中文

AIbase

智启未来，您的人工智能解决方案智库

简体中文

© 2025AIbase 备案号：闽ICP备08105208号-24