G

Gigaam Ctc

由 waveletdeboshir 开发
GigaAM-v2-CTC 是一个俄语自动语音识别(ASR)模型,基于CTC损失函数训练,可通过Hugging Face transformers库使用。
下载量 255
发布时间 : 3/18/2025
模型介绍
内容详情
替代品

模型简介

这是一个俄语自动语音识别模型,带有transformers库接口,支持将俄语语音转换为文本。

模型特点

transformers兼容接口
模型提供与Hugging Face transformers库兼容的接口,便于集成和使用
俄语语音识别
专门针对俄语语音优化的自动语音识别能力
CTC训练
使用CTC(Connectionist Temporal Classification)损失函数训练,适合序列对齐任务

模型能力

俄语语音识别
音频转文本
自动语音识别

使用案例

语音转录
俄语会议记录
将俄语会议录音自动转换为文字记录
俄语媒体内容字幕生成
为俄语视频或播客自动生成字幕