V

Vegam Whisper Medium Ml

由 smcproject 开发
这是将thennal/whisper-medium-ml转换为CTranslate2模型格式的版本,用于马拉雅拉姆语语音识别
下载量 83
发布时间 : 5/19/2023

模型简介

该模型是基于Whisper架构的马拉雅拉姆语自动语音识别(ASR)模型,转换为CTranslate2格式以提高推理速度

模型特点

高效推理
转换为CTranslate2格式,支持使用faster-whisper进行快速推理
多数据集训练
基于google/fleurs、thennal/IMaSC和mozilla-foundation/common_voice_11_0等多个数据集训练
多精度支持
支持FP16和INT8等多种计算精度,可在不同硬件上优化性能

模型能力

马拉雅拉姆语语音识别
音频转文本
多精度推理

使用案例

语音转录
音频文件转录
将马拉雅拉姆语语音文件转换为文本
示例中展示了准确的语音识别结果
语音处理应用
语音助手
用于开发马拉雅拉姆语语音助手
AIbase
智启未来,您的人工智能解决方案智库
简体中文