wav2vec2-russian开源俄语语音识别模型 - 免费使用并支持文本纠错

首页

Wav2vec2 Russian

由 UrukHan 开发

基于wav2vec2架构的俄语语音识别模型，识别结果可通过配套文本纠错网络进行后处理

语音识别

Transformers

#俄语语音识别 #音频转文本 #军事领域应用

下载量 100

发布时间 : 3/27/2022

模型简介

该模型专为俄语语音识别任务设计，能够将俄语语音转换为文本，并建议配合UrukHan/t5-russian-spell模型进行文本纠错和格式化处理

模型特点

俄语语音识别

专门针对俄语优化的语音识别能力

纠错网络兼容

识别结果可无缝对接UrukHan/t5-russian-spell模型进行文本纠错和格式化

实用示例支持

提供Colab笔记本展示完整使用流程

模型能力

俄语语音识别

音频转文本

支持wav格式音频输入

使用案例

语音转录

新闻语音转录

将俄语新闻广播转换为文本

如示例所示，能有效识别军事新闻内容

语音辅助工具

语音笔记转换

将俄语语音笔记转换为可编辑文本

🚀 wav2vec2-russian

这是一个用于音频识别的模型。该模型的识别结果可以进一步通过另一个文本纠错网络 UrukHan/t5-russian-spell 进行处理。

🚀 快速开始

运行网络示例

你可以在 Colab 中查看运行示例：点击查看。以下是具体代码：

from transformers import AutoModelForCTC, Wav2Vec2Processor
model = AutoModelForCTC.from_pretrained("UrukHan/wav2vec2-russian")
processor = Wav2Vec2Processor.from_pretrained("UrukHan/wav2vec2-russian")
def map_to_result(batch):
  with torch.no_grad():
    input_values = torch.tensor(batch["input_values"]).unsqueeze(0) #, device="cuda"
    logits = model(input_values).logits
  pred_ids = torch.argmax(logits, dim=-1)
  batch = processor.batch_decode(pred_ids)[0]
  return batch
 
map_to_result()

模型训练

你可以在 Colab 中查看模型训练、数据处理和创建数据集的相关内容：点击查看。

✨ 主要特性

该模型可用于音频识别，并且识别结果可通过 UrukHan/t5-russian-spell 网络进行文本纠错、标点符号调整和数字修正。以下是模型输出与纠错网络输出的对比示例：

输出类型	详情
wav2vec2 输出	ывсем привет выныканалетоп армии и это двадцать пятый день спец операций на украине ет самый главной новости российские военные ракетами кинжалы калибр уничтожили крупную военную топливную базу украины ракетным ударом по населенному пункту под жетамиром уничтжены более стаукраинских военных в две тысячи двадцать втором году
纠错网络输出	Всем привет! Вы в курсе новостей от армии. И это 25 день спецопераций на Украине. Есть самые главные новости. Российские военные ракетами «Кинжалы» и «Кинжалы» калибра уничтожили крупную военную топливную базу Украины. Ракетным ударом по населенному пункту под Жетамиром уничтожены более ста украинских военных в 2022г.

输出类型

详情

wav2vec2 输出

ывсем привет выныканалетоп армии и это двадцать пятый день спец операций на украине ет самый главной новости российские военные ракетами кинжалы калибр уничтожили крупную военную топливную базу украины ракетным ударом по населенному пункту под жетамиром уничтжены более стаукраинских военных в две тысячи двадцать втором году

纠错网络输出

Всем привет! Вы в курсе новостей от армии. И это 25 день спецопераций на Украине. Есть самые главные новости. Российские военные ракетами «Кинжалы» и «Кинжалы» калибра уничтожили крупную военную топливную базу Украины. Ракетным ударом по населенному пункту под Жетамиром уничтожены более ста украинских военных в 2022г.