G

Gigaam Ctc With Lm

由 waveletdeboshir 开发
俄语自动语音识别模型,支持外部ngram语言模型和束搜索解码,可提取词级时间戳
下载量 30
发布时间 : 5/13/2025
模型介绍
内容详情
替代品

模型简介

这是一个基于Conformer架构的俄语语音识别模型,集成了transformers库接口,支持使用外部ngram语言模型进行重打分和束搜索解码,同时具备词级时间戳提取功能。

模型特点

语言模型集成
支持外部ngram语言模型重打分,提高识别准确率
束搜索解码
使用束搜索算法进行解码,优化识别结果
时间戳提取
可提取词级时间戳,支持语音对齐分析
Transformers兼容
完全兼容Hugging Face transformers库,便于集成

模型能力

俄语语音识别
语音转文字
词级时间戳提取

使用案例

语音转录
俄语会议记录
将俄语会议录音自动转换为文字记录
生成带时间戳的会议文字稿
媒体字幕生成
为俄语视频内容自动生成字幕
同步的字幕文件
语音分析
语音内容分析
分析俄语语音内容并提取关键词
带时间标记的关键词列表