Speecht5 Finetuned Google Fleurs Greek

S

Speecht5 Finetuned Google Fleurs Greek

由 Sandiago21 开发

基于microsoft/speecht5_tts微调的希腊语文本转语音模型

开源协议:MIT #希腊语语音合成 #SpeechT5微调 #多语言TTS

下载量 17

发布时间 : 7/14/2023

模型简介

该模型是Microsoft SpeechT5架构的微调版本，专门用于希腊语的文本转语音任务。

模型特点

希腊语优化

专门针对希腊语语音特性进行微调

基于SpeechT5

使用微软先进的SpeechT5架构作为基础模型

高质量语音合成

能够生成自然流畅的希腊语语音

模型能力

希腊语文本转语音

语音合成

使用案例

语音应用

语音助手

为希腊语语音助手提供语音合成能力

有声读物

将希腊语文本转换为语音用于有声读物制作

🚀 语音T5微调希腊语模型

本模型是基于文本转语音任务的模型，它在microsoft/speecht5_tts基础上进行微调，可实现文本到语音的转换，为希腊语语音合成提供了有效的解决方案。

🚀 快速开始

此模型是 microsoft/speecht5_tts 在某个数据集（文档未明确提及）上的微调版本。在评估集上取得了以下结果：

损失值：0.3920

🔧 技术细节

训练超参数

训练过程中使用了以下超参数：

学习率：2.5e - 05
训练批次大小：8
评估批次大小：8
随机种子：42
梯度累积步数：4
总训练批次大小：32
优化器：Adam（β1 = 0.9，β2 = 0.999，ε = 1e - 08）
学习率调度器类型：线性
学习率调度器热身步数：100
训练轮数：40

训练结果

训练损失	轮数	步数	验证损失
0.5174	1.0	583	0.4863
0.4948	2.0	1166	0.4611
0.4723	3.0	1749	0.4503
0.4763	4.0	2333	0.4438
0.4614	5.0	2916	0.4407
0.4569	6.0	3499	0.4387
0.4538	7.0	4082	0.4306
0.4539	8.0	4666	0.4282
0.4564	9.0	5249	0.4230
0.4493	10.0	5832	0.4222
0.445	11.0	6415	0.4190
0.4564	12.0	6999	0.4195
0.4381	13.0	7582	0.4161
0.4328	14.0	8165	0.4147
0.4424	15.0	8748	0.4140
0.4282	16.0	9332	0.4117
0.4349	17.0	9915	0.4090
0.4381	18.0	10498	0.4090
0.4328	19.0	11081	0.4073
0.4347	20.0	11665	0.4079
0.4293	21.0	12248	0.4055
0.4251	22.0	12831	0.4052
0.4359	23.0	13414	0.4023
0.4311	24.0	13998	0.4016
0.421	25.0	14581	0.4014
0.4162	26.0	15164	0.3991
0.4219	27.0	15747	0.3990
0.4247	28.0	16331	0.3989
0.4188	29.0	16914	0.3974
0.4229	30.0	17497	0.3976
0.4246	31.0	18080	0.3960
0.4219	32.0	18664	0.3956
0.4228	33.0	19247	0.3951
0.4183	34.0	19830	0.3946
0.4097	35.0	20413	0.3936
0.4245	36.0	20997	0.3935
0.4184	37.0	21580	0.3930
0.4198	38.0	22163	0.3937
0.4193	39.0	22746	0.3925
0.4096	39.98	23320	0.3920

框架版本

Transformers 4.30.0.dev0
Pytorch 2.0.1+cu117
Datasets 2.13.1
Tokenizers 0.13.3

📄 许可证

本模型采用 MIT 许可证。

属性	详情
模型类型	基于微调的文本转语音模型
基础模型	microsoft/speecht5_tts

精选推荐AI模型

Llama 3 Typhoon V1.5x 8b Instruct

专为泰语设计的80亿参数指令模型，性能媲美GPT-3.5-turbo，优化了应用场景、检索增强生成、受限生成和推理任务

大型语言模型

Transformers 支持多种语言

Cadet-Tiny是一个基于SODA数据集训练的超小型对话模型，专为边缘设备推理设计，体积仅为Cosmo-3B模型的2%左右。

Transformers 英语

Roberta Base Chinese Extractive Qa

基于RoBERTa架构的中文抽取式问答模型，适用于从给定文本中提取答案的任务。

问答系统中文

AIbase

智启未来，您的人工智能解决方案智库

简体中文

© 2025AIbase 备案号：闽ICP备08105208号-24