W

Whisper Large V3 Distil Multi7 V0.2

由 bofenghuang 开发
一个多语言蒸馏版Whisper模型,支持7种欧洲语言的自动语音识别,具有语码转换能力
下载量 119
发布时间 : 12/5/2024
模型介绍
内容详情
替代品

模型简介

这是一个基于Whisper-Large-v3的蒸馏模型,专为7种欧洲语言(英语、法语、西班牙语、德语、意大利语、葡萄牙语和荷兰语)的自动语音识别优化。模型具有2个解码器层,特别支持语码转换功能,能自动检测并处理多语言混合的语音输入。

模型特点

多语言支持
支持7种欧洲语言的语音识别(英语、法语、西班牙语、德语、意大利语、葡萄牙语和荷兰语)
语码转换能力
能够自动检测语音中的语言变化并生成相应的语言标记,实现无缝的多语言转录
高效蒸馏架构
仅保留2个解码器层,在保持良好性能的同时提高推理效率

模型能力

自动语音识别
多语言转录
语码转换检测
语音到文本转换

使用案例

多语言转录
多语言会议记录
自动转录包含多种语言的会议录音
能准确识别语言切换并生成相应语言的文本
多语言媒体内容处理
处理包含多种语言的播客、视频等媒体内容
生成带语言标记的转录文本
语音分析
多语言语音数据分析
分析包含多种语言的语音数据集
提供准确的文本转录用于后续分析