P

Parakeet Tdt Ctc 0.6b Ja

由 mlx-community 开发
该模型是基于FastConformer架构的日语自动语音识别(ASR)模型,由NVIDIA开发并转换为MLX格式。
下载量 368
发布时间 : 5/6/2025
模型介绍
内容详情
替代品

模型简介

这是一个用于日语语音识别的自动语音识别(ASR)模型,基于FastConformer架构,能够将日语语音转换为文本。

模型特点

高效语音识别
基于FastConformer架构,提供高效的日语语音识别能力
MLX兼容
已转换为MLX格式,可在MLX生态系统中使用
大模型规模
拥有0.6B参数,具备较强的语音识别能力

模型能力

日语语音识别
音频转文本
自动语音识别

使用案例

语音转写
日语会议记录
将日语会议录音自动转换为文字记录
生成准确的会议文字记录
日语字幕生成
为日语视频内容自动生成字幕
提高视频内容可访问性
语音助手
日语语音输入
为日语语音助手提供语音识别能力
实现自然语言交互