🚀 vegam-whipser-medium-ml (വേഗം)
这是将 thennal/whisper-medium-ml 转换为 CTranslate2 模型格式的项目。该模型可用于 CTranslate2 或基于 CTranslate2 的项目,如 faster-whisper。
🚀 快速开始
本项目可用于语音识别,通过转换后的模型能在 CTranslate2 及其相关项目中高效运行。
✨ 主要特性
- 支持在 CTranslate2 及基于 CTranslate2 的项目(如 faster-whisper)中使用。
- 可在 GPU 上以 FP16 或 INT8 模式运行,也能在 CPU 上以 INT8 模式运行。
📦 安装指南
安装 faster-whisper
pip install faster-whisper
更多安装细节可 在此查看。
安装 git-lfs
apt-get install git-lfs
git-lfs 仅用于从 hugging-face 下载模型。对于非 Debian 系统,可参考其他下载方式。
下载模型权重
git lfs install
git clone https://huggingface.co/kurianbenoy/vegam-whisper-medium-ml
💻 使用示例
基础用法
from faster_whisper import WhisperModel
model_path = "vegam-whisper-medium-ml"
model = WhisperModel(model_path, device="cuda", compute_type="float16")
segments, info = model.transcribe("audio.mp3", beam_size=5)
print("Detected language '%s' with probability %f" % (info.language, info.language_probability))
for segment in segments:
print("[%.2fs -> %.2fs] %s" % (segment.start, segment.end, segment.text))
高级用法
from faster_whisper import WhisperModel
model_path = "vegam-whisper-medium-ml"
model = WhisperModel(model_path, device="cuda", compute_type="float16")
segments, info = model.transcribe("00b38e80-80b8-4f70-babf-566e848879fc.webm", beam_size=5)
print("Detected language '%s' with probability %f" % (info.language, info.language_probability))
for segment in segments:
print("[%.2fs -> %.2fs] %s" % (segment.start, segment.end, segment.text))
示例输出:
Detected language 'ta' with probability 0.353516
[0.00s -> 4.74s] പാലം കടുക്കുവോളം നാരായണ പാലം കടന്നാലൊ കൂരായണ
注意:音频文件 00b38e80-80b8-4f70-babf-566e848879fc.webm 来自 Malayalam Speech Corpus,并与模型权重一起存储。
🔧 技术细节
本转换借助了出色的 CTranslate2 库,利用 Transformers converter for OpenAI Whisper 完成。原始模型通过以下命令进行转换:
ct2-transformers-converter --model thennal/whisper-medium-ml --output_dir vegam-whisper-medium-ml
📄 许可证
本项目采用 MIT 许可证。
👏 特别感谢
- CTranslate2 和 faster-whisper 的开发者
- Thennal D K
- Santhosh Thottingal
⚠️ 重要提示
模型文件大小为 3.06 GB。
属性 |
详情 |
模型类型 |
语音识别模型 |
训练数据 |
google/fleurs、thennal/IMaSC、mozilla-foundation/common_voice_11_0 |
库名称 |
ctranslate2 |