A

Anime Whisper

由 litagin 开发
专精于日式动画风格表演台词领域的日语语音识别模型
下载量 4,873
发布时间 : 11/10/2024
模型介绍
内容详情
替代品

模型简介

基于kotoba-whisper-v2.0微调,针对动画风格语音优化的日语ASR模型,特别擅长处理非语言发声和情感表达

模型特点

减少幻觉现象
相比同类模型显著减少了错误生成内容的情况
非语言发声识别
精准捕捉言语停顿、笑声、呼喊、喘息等非语言发声
情感化标点生成
标点符号随语音节奏情感自然生成,呈现剧本级文本流畅度
动画语音优化
对动画风格表演台词识别准确率尤为突出
NSFW内容处理
能专业处理其他模型难以胜任的成人向音频转写

模型能力

日语语音识别
动画风格语音转写
非语言发声识别
情感化文本生成

使用案例

动漫制作
动画配音转写
将动画配音转换为剧本格式文本
准确率比通用模型提高约20%
游戏开发
视觉小说台词转录
自动转录Galgame游戏中的对话内容
CER(字符错误率)平均13.0%