F

Fireredasr LLM L

由 FireRedTeam 开发
FireRedASR是一系列支持普通话、中国方言和英语的开源工业级自动语音识别(ASR)模型,在公开的普通话ASR基准测试中实现了新的最先进水平(SOTA),同时具备出色的歌词识别能力。
下载量 151
发布时间 : 2/10/2025
模型介绍
内容详情
替代品

模型简介

FireRedASR旨在满足不同应用场景中对卓越性能和最优效率的多样化需求,包含两种变体:FireRedASR-LLM和FireRedASR-AED。

模型特点

多语言支持
支持普通话、中国方言和英语的语音识别
工业级性能
在公开的普通话ASR基准测试中实现了新的最先进水平(SOTA)
双架构设计
提供FireRedASR-LLM和FireRedASR-AED两种架构,满足不同性能与效率需求
歌词识别能力
具备出色的歌词识别能力

模型能力

普通话语音识别
英语语音识别
中国方言语音识别
歌词识别

使用案例

语音转文字
会议记录
将会议录音转换为文字记录
在ws_meeting数据集上CER为4.67%
语音助手
用于语音助手中的语音识别模块
媒体处理
字幕生成
为视频内容自动生成字幕
歌词识别
从音乐中识别歌词