F

Fireredasr AED L

由 FireRedTeam 开发
FireRedASR是一系列支持普通话、汉语方言和英语的开源工业级自动语音识别(ASR)模型,在公开普通话ASR基准测试中达到最新最优(SOTA)水平,同时具备卓越的歌词识别能力。
下载量 216
发布时间 : 1/24/2025
模型介绍
内容详情
替代品

模型简介

FireRedASR为满足不同应用场景对卓越性能和最优效率的多样化需求,设计了两类变体:FireRedASR-LLM和FireRedASR-AED。前者采用编码器-适配器-大语言模型框架,旨在实现SOTA性能并支持端到端语音交互;后者基于注意力机制的编码器-解码器架构,平衡高性能与计算效率,可作为基于LLM的语音模型中的高效语音表征模块。

模型特点

多语言支持
支持普通话、汉语方言和英语的自动语音识别
工业级性能
在公开普通话ASR基准测试中达到SOTA水平
卓越的歌词识别能力
具备优秀的歌词识别性能
两种架构选择
提供LLM和AED两种架构,满足不同场景需求

模型能力

普通话语音识别
汉语方言语音识别
英语语音识别
歌词识别

使用案例

语音转文字
会议记录
将会议录音转换为文字记录
在ws_meeting数据集上CER为4.67%
语音助手
用于智能语音助手中的语音识别模块
多媒体处理
字幕生成
为视频内容自动生成字幕
歌词识别
从音乐中识别歌词
具备卓越的歌词识别能力