Speecht5 Finetuned Voxpopuli Italy
基于微软SpeechT5 TTS模型微调的意大利语文本转语音模型,使用Facebook Voxpopuli数据集训练
下载量 27
发布时间 : 11/28/2023
模型简介
该模型是微软SpeechT5 TTS的意大利语微调版本,专门用于将意大利语文本转换为自然语音
模型特点
意大利语优化
专门针对意大利语语音特性进行微调优化
基于SpeechT5架构
采用微软先进的SpeechT5文本转语音架构
高质量数据集
使用Facebook Voxpopuli专业语音数据集训练
模型能力
意大利语文本转语音
语音合成
使用案例
语音应用
语音助手
为意大利语语音助手提供自然语音输出
有声读物
将意大利语文本转换为语音用于有声读物制作
精选推荐AI模型
Qwen2.5 VL 7B Abliterated Caption It I1 GGUF
Apache-2.0
Qwen2.5-VL-7B-Abliterated-Caption-it的量化版本,支持多语言图像描述任务。
图像生成文本
Transformers 支持多种语言

Q
mradermacher
167
1
Nunchaku Flux.1 Dev Colossus
其他
Colossus Project Flux 的 Nunchaku 量化版本,旨在根据文本提示生成高质量图像。该模型在优化推理效率的同时,将性能损失降至最低。
图像生成 英语
N
nunchaku-tech
235
3
Qwen2.5 VL 7B Abliterated Caption It GGUF
Apache-2.0
这是一个基于Qwen2.5-VL-7B模型的静态量化版本,专注于图像描述生成任务,支持多种语言。
图像生成文本
Transformers 支持多种语言

Q
mradermacher
133
1
Olmocr 7B 0725 FP8
Apache-2.0
olmOCR-7B-0725-FP8是基于Qwen2.5-VL-7B-Instruct模型,使用olmOCR-mix-0225数据集微调后量化为FP8版本的文档OCR模型。
图像生成文本
Transformers 英语

O
allenai
881
3
Lucy 128k GGUF
Apache-2.0
Lucy-128k是基于Qwen3-1.7B开发的专注于代理式网络搜索和轻量级浏览的模型,在移动设备上也能高效运行。
大型语言模型
Transformers 英语

L
Mungert
263
2