A

Audio Transcribe

由 washeed 开发
这是一个基于Transformers的自动语音识别(ASR)模型,用于将音频文件转录为文本。
下载量 257
发布时间 : 2/3/2024
模型介绍
内容详情
替代品

模型简介

该模型主要用于语音到文本的转录任务,支持高效批处理和时间戳返回功能。

模型特点

高效批处理
支持批量处理音频文件,提高处理效率
时间戳返回
可以返回转录文本对应的时间戳信息
GPU加速
支持CUDA加速,提高推理速度

模型能力

音频转录
语音识别
时间戳生成

使用案例

会议记录
自动会议纪要
将会议录音自动转换为文字记录
提高会议记录效率,减少人工转录时间
媒体制作
视频字幕生成
为视频内容自动生成字幕
简化字幕制作流程