语言:
- 意大利语
许可证: apache-2.0
数据集:
- mozilla-foundation/common_voice_8_0
评估指标:
- 词错误率(wer)
- 字符错误率(cer)
标签:
- 音频
- 自动语音识别
- hf-asr排行榜
- 意大利语
- mozilla-foundation/common_voice_8_0
- 语音
- wav2vec2
模型索引:
- 名称: radiogroup crits的XLS-R Wav2Vec2意大利语模型
结果:
- 任务:
名称: 语音识别
类型: 自动语音识别
数据集:
名称: Common Voice 8.0 意大利语
类型: mozilla-foundation/common_voice_8_0
参数: it
指标:
- 名称: 测试集词错误率
类型: wer
值: 9.04
- 名称: 测试集字符错误率
类型: cer
值: 2.2
- 名称: 测试集词错误率(带语言模型)
类型: wer
值: 6.24
- 名称: 测试集字符错误率(带语言模型)
类型: cer
值: 1.67
XLS-R-1B-意大利语-DOC4LM-5GRAM
针对意大利语语音识别微调的XLS-R 10亿参数模型
本模型基于facebook/wav2vec2-xls-r-1b,使用Common Voice 8.0的训练集和验证集、Multilingual TEDx、Multilingual LibriSpeech以及Voxpopuli的意大利语数据进行微调。
使用本模型时,请确保语音输入采样率为16kHz。
语言模型信息
我们的语言模型是通过意大利语维基百科文章以及广播新闻和电视节目的手工转录文本数据集生成的。
下载CommonVoice8.0意大利语数据集
from datasets import load_dataset
dataset = load_dataset("mozilla-foundation/common_voice_8_0", "it", use_auth_token=True)
评估命令
在mozilla-foundation/common_voice_8_0
数据集的test
分割上进行评估:
python eval.py --model_id radiogroup-crits/wav2vec2-xls-r-1b-italian-doc4lm-5gram --dataset mozilla-foundation/common_voice_8_0 --config it --split test --log_outputs --greedy
mv log_mozilla-foundation_common_voice_8_0_it_test_predictions.txt log_mozilla-foundation_common_voice_8_0_it_test_predictions_greedy.txt
mv log_mozilla-foundation_common_voice_8_0_it_test_targets.txt log_mozilla-foundation_common_voice_8_0_it_test_targets_greedy.txt
mv mozilla-foundation_common_voice_8_0_it_test_eval_results.txt mozilla-foundation_common_voice_8_0_it_test_eval_results_greedy.txt
python eval.py --model_id radiogroup-crits/wav2vec2-xls-r-1b-italian-doc4lm-5gram --dataset mozilla-foundation/common_voice_8_0 --config it --split test --log_outputs
mv log_mozilla-foundation_common_voice_8_0_it_test_predictions.txt log_mozilla-foundation_common_voice_8_0_it_test_predictions_lm.txt
mv log_mozilla-foundation_common_voice_8_0_it_test_targets.txt log_mozilla-foundation_common_voice_8_0_it_test_targets_lm.txt
mv mozilla-foundation_common_voice_8_0_it_test_eval_results.txt mozilla-foundation_common_voice_8_0_it_test_eval_results_lm.txt
引用
如需引用本模型,请使用以下格式:
@misc{crits2022wav2vec2-xls-r-1b-italian-doc4lm-5gram,
标题={radiogroup crits的XLS-R Wav2Vec2意大利语模型},
作者={Teraoni Prioletti Raffaele, Casagranda Paolo 和 Russo Francesco},
出版社={Hugging Face},
期刊={Hugging Face Hub},
网址={https://huggingface.co/radiogroup-crits/wav2vec2-xls-r-1b-italian-doc4lm-5gram},
年份={2022}
}