日语语音识别
Parakeet Tdt Ctc 0.6b Ja
该模型是基于FastConformer架构的日语自动语音识别(ASR)模型,由NVIDIA开发并转换为MLX格式。
语音识别
P
mlx-community
368
1
Kotoba Whisper V2.2 Faster
MIT
这是一个基于Whisper架构的日语自动语音识别(ASR)模型,已转换为CTranslate2格式以提高推理效率。
语音识别
日语
K
RoachLin
99
1
Vlzcrz Whisper Small Japanese 2
Apache-2.0
基于openai/whisper-small在Common Voice 17.0数据集上微调的日语语音识别模型
语音识别
Transformers
日语
V
vlzcrz
28
1
Japanese Wav2vec2 Large Rs35kh
Apache-2.0
基于wav2vec 2.0 Large架构,在大型日语ASR语料库ReazonSpeech v2.0上微调而成的日语自动语音识别模型
语音识别
Transformers
日语
J
reazon-research
244
1
Kotoba Whisper V2.2
Apache-2.0
基于Whisper的日语自动语音识别模型,集成说话人分离和标点符号添加功能
语音识别
Transformers
日语
K
kotoba-tech
22.80k
47
Kotoba Whisper V2.0 Faster
MIT
适用于CTranslate2的Whisper语音识别模型,专为日语优化,提供高效的语音转文本功能。
语音识别
日语
K
kotoba-tech
202
14
Kotoba Whisper V2.1
Apache-2.0
Kotoba-Whisper-v2.1 是一款基于 Whisper 的日语自动语音识别(ASR)模型,集成了额外的后处理栈,能够自动添加标点符号。
语音识别
Transformers
日语
K
kotoba-tech
2,589
16
Kotoba Whisper V2.0
Apache-2.0
Kotoba-Whisper是由Asahi Ushio与Kotoba Technologies合作开发的日语自动语音识别蒸馏模型,基于Whisper large-v3蒸馏而来,推理速度提升6.3倍。
语音识别
Transformers
日语
K
kotoba-tech
8,108
60
Parakeet Tdt Ctc 0.6b Ja
Parakeet TDT-CTC 0.6B是一个能够转录带标点符号的日语语音的自动语音识别(ASR)模型,由NVIDIA NeMo团队开发。
语音识别
日语
P
nvidia
4,184
22
Kotoba Whisper V1.1
Apache-2.0
Kotoba-Whisper-v1.1是基于Whisper的日语自动语音识别模型,增加了标点符号和时间戳处理功能。
语音识别
Transformers
日语
K
kotoba-tech
476
33
Wav2vec2 Base Japanese Asr
Apache-2.0
基于rinna/japanese-wav2vec2-base在common_voice_11_0日语数据集上微调的语音识别模型,仅支持平假名输出
语音识别
Transformers
日语
W
TKU410410103
68
3
Kotoba Whisper V1.0
Apache-2.0
Kotoba-Whisper 是由 Asahi Ushio 和 Kotoba Technologies 合作开发的日语自动语音识别蒸馏版 Whisper 模型集合,比原版 large-v3 快 6.3 倍,同时保持相近的低错误率。
语音识别
Transformers
日语
K
kotoba-tech
2,397
53
Whisper Large V3 Japanese 4k Steps
Apache-2.0
基于openai/whisper-large-v3在Common Voice 16.1日语数据集上微调的语音识别模型,训练4000步
语音识别
Transformers
日语
W
drewschaub
94
4
Nue Asr
Apache-2.0
Nue ASR是一种端到端的日语语音识别模型,集成了预训练的语音和语言模型,识别准确度高且速度快。
语音识别
Transformers
支持多种语言
N
rinna
722
24
Faster Whisper Large V2 Mix Jp
这是whisper-large-v2-mix-jp模型的CTranslate2转换版本,适用于日语语音识别任务
语音识别
日语
F
arc-r
64
9
Faster Whisper Large V2 Japanese 5k Steps
MIT
基于Whisper Large V2模型的日语自动语音识别(ASR)模型,使用CTranslate2优化转换,支持高效推理。
语音识别
Transformers
日语
F
zh-plus
280
18
Whisper Small Japanese
Apache-2.0
该模型是基于openai/whisper-small微调的日语语音识别模型,支持日语语音转文本任务。
语音识别
Transformers
日语
W
Ivydata
356
5
Whisper Base Japanese
Apache-2.0
本模型使用Common Voice、JVS和JSUT数据集对openai/whisper-base进行日语微调,适用于日语语音识别任务。
语音识别
Transformers
日语
W
Ivydata
137
3
Wav2vec2 Large Xlsr 53 Japanese
Apache-2.0
基于facebook/wav2vec2-large-xlsr-53微调的日语语音识别模型,支持16kHz采样率音频输入
语音识别
Transformers
日语
W
Ivydata
19
4
Whisper Large V2 Mix Jp
Apache-2.0
基于OpenAI Whisper-large-v2模型在日语语音数据集上微调的自动语音识别(ASR)模型
语音识别
Transformers
W
vumichien
93
9
Whisper Medium Jp
Apache-2.0
基于openai/whisper-medium在common_voice_11_0数据集上微调的日语语音识别模型
语音识别
Transformers
日语
W
vumichien
4,542
25
Exp W2v2t Ja Vp It S544
Apache-2.0
基于facebook/wav2vec2-large-it-voxpopuli模型,使用Common Voice 7.0 (日语版)的训练集进行语音识别微调的日语自动语音识别模型。
语音识别
Transformers
日语
E
jonatasgrosman
18
0
Exp W2v2t Ja Unispeech Sat S884
Apache-2.0
基于microsoft/unispeech-sat-large模型微调的日语自动语音识别模型,使用Common Voice 7.0日语数据集训练。
语音识别
Transformers
日语
E
jonatasgrosman
19
0
Exp W2v2t Ja Wavlm S729
Apache-2.0
基于microsoft/wavlm-large模型微调的日语自动语音识别模型,使用Common Voice 7.0日语数据集训练
语音识别
Transformers
日语
E
jonatasgrosman
15
2
Exp W2v2t Ja Unispeech S569
Apache-2.0
基于microsoft/unispeech-large-1500h-cv模型,使用Common Voice 7.0 (日语)数据集进行语音识别微调的日语自动语音识别模型
语音识别
Transformers
日语
E
jonatasgrosman
14
0
Exp W2v2t Ja Xlsr 53 S109
Apache-2.0
基于facebook/wav2vec2-large-xlsr-53模型微调的日语自动语音识别模型,使用Common Voice 7.0日语数据集训练
语音识别
Transformers
日语
E
jonatasgrosman
20
0
Wav2vec2 Xls R 300m Japanese
Apache-2.0
这是一个基于facebook/wav2vec2-xls-r-300m微调的日语自动语音识别模型,专门用于将日语音频转录为平假名文本。
语音识别
Transformers
日语
W
vitouphy
29
0
W2v Hf Commonvoice From Xlsr53 Pretrain 0329UTC1500
基于facebook/wav2vec2-large-xlsr-53在Common Voice日语数据集上微调的语音识别模型
语音识别
Transformers
W
qqpann
15
0
Wav2vec2 Large Xlsr Japanese 0325 1200
Apache-2.0
这是一个基于facebook/wav2vec2-large-xlsr-53模型在日语语音识别任务上微调的自动语音识别(ASR)模型。
语音识别
Transformers
日语
W
qqpann
14
0
W2v Hf Jsut Xlsr53
Apache-2.0
基于facebook/wav2vec2-large-xlsr-53模型,使用Common Voice和JSUT数据集对日语进行了微调的自动语音识别模型。
语音识别
Transformers
日语
W
qqpann
16
1
Kan Bayashi Csj Asr Train Asr Transformer Raw Char Sp Valid.acc.ave
这是一个基于ESPnet框架训练的日语自动语音识别(ASR)模型,使用CSJ数据集训练,采用Transformer架构。
语音识别
日语
K
espnet
13
0
Wav2vec2 Xls R 1b Japanese
Apache-2.0
该模型是基于facebook/wav2vec2-xls-r-1b在公共日语语音数据集上进行微调的版本,支持日语自动语音识别任务。
语音识别
Transformers
日语
W
vumichien
50
2
Wav2vec2 Large Xlsr Japanese
Apache-2.0
基于facebook/wav2vec2-large-xlsr-53在日语上的微调模型,支持日语语音识别任务。
语音识别
Transformers
日语
W
vumichien
214
5
Wav2vec2 Large Xlsr 53 Japanese
Apache-2.0
基于facebook/wav2vec2-large-xlsr-53模型微调的日语语音识别模型,支持16kHz采样率的语音输入
语音识别
日语
W
jonatasgrosman
2.9M
33
Wav2vec2 Large Xlsr Japanese Hiragana
Apache-2.0
基于facebook/wav2vec2-large-xlsr-53模型微调的日语语音识别模型,支持平假名输出
语音识别
Transformers
日语
W
vumichien
90
7
Wav2vec2 Live Japanese
Apache-2.0
基于facebook/wav2vec2-large-xlsr-53微调的日语语音识别模型,支持平假名输出
语音识别
Transformers
日语
W
ttop324
20
4
Wav2vec2 Xls R 300m Japanese
Apache-2.0
这是一个基于facebook/wav2vec2-xls-r-300m在日语Common Voice 8.0数据集上微调的自动语音识别(ASR)模型,支持日语语音转文字功能。
语音识别
Transformers
日语
W
AndrewMcDowell
24
0
Wav2vec2 Large Japanese
基于facebook/wav2vec2-large-xlsr-53模型微调的日语语音识别模型,支持16kHz采样率输入
语音识别
日语
W
NTQAI
316
7