faster-distil-whisper-large-v2开源语音识别模型 - 免费部署快速将英语语音转文本

首页

Faster Distil Whisper Large V2

由 Systran 开发

这是一个基于Whisper架构的蒸馏版本自动语音识别(ASR)模型，专为高效推理设计，适用于英语语音转文本任务。

语音识别英语开源协议:MIT #高效语音识别 #多语言支持 #低延迟推理

下载量 1,336

发布时间 : 1/19/2024

模型简介

该模型是Whisper大型v2模型的蒸馏版本，保留了原始模型的高准确性同时显著提升了推理速度，适用于需要实时语音识别的应用场景。

模型特点

高效推理

通过知识蒸馏技术优化，相比原始Whisper模型显著提升了推理速度

高准确率

保留了原始Whisper大型v2模型的识别准确率

CTranslate2兼容

已转换为CTranslate2格式，可与faster-whisper等高效推理库配合使用

FP16量化

模型权重以FP16格式保存，平衡了精度和性能需求

模型能力

英语语音识别

长音频转录

实时语音转文本

使用案例

语音转录

会议记录自动化

自动将英语会议录音转换为文字记录

高效生成可搜索的会议文本记录

播客转录

将英语播客内容自动转换为文字稿

快速生成可供编辑和发布的文字内容

辅助技术

实时字幕生成

为英语视频或直播提供实时字幕

提升内容可访问性

精选推荐AI模型

Llama 3 Typhoon V1.5x 8b Instruct

专为泰语设计的80亿参数指令模型，性能媲美GPT-3.5-turbo，优化了应用场景、检索增强生成、受限生成和推理任务

Cadet-Tiny是一个基于SODA数据集训练的超小型对话模型，专为边缘设备推理设计，体积仅为Cosmo-3B模型的2%左右。

Roberta Base Chinese Extractive Qa

基于RoBERTa架构的中文抽取式问答模型，适用于从给定文本中提取答案的任务。

问答系统中文

uer

2,694

智启未来，您的人工智能解决方案智库

简体中文

Faster Distil Whisper Large V2

模型简介

模型特点

模型能力

使用案例

🚀 CTranslate2的Whisper distil-large-v2模型

🚀 快速开始

✨ 主要特性

💻 使用示例

基础用法

🔧 技术细节

转换详情

📚 详细文档

📄 许可证