H

Hamsa V0.1 Beta

由 nadsoft 开发
Hamsa是基于Whisper模型构建的阿拉伯语语音识别模型,专注于中东和北非地区的语言需求。
下载量 46
发布时间 : 10/20/2023
模型介绍
内容详情
替代品

模型简介

Hamsa(همسة)是一个预训练的阿拉伯语自动语音识别(ASR)模型,致力于解决阿拉伯语独特的语言细微差异,特别适合中东和北非地区使用。

模型特点

阿拉伯语优化
专门针对阿拉伯语进行优化,解决中东和北非地区特有的语言细微差异。
多数据源训练
结合多个阿拉伯语语音数据集进行训练,包括nadsoft/Jordan-Audio、google/fleurs和common_voice_11_0。
技术先进
采用Whisper模型架构,使用Adam优化器和混合精度训练等先进技术。

模型能力

阿拉伯语语音识别
标准阿拉伯语转录
语音转文本

使用案例

语音转录
标准阿拉伯语转录
将标准阿拉伯语语音转换为文本
词错误率(WER)为18.22
教育
阿拉伯语学习辅助
帮助学习者练习阿拉伯语发音和转录