Free Svc
模型简介
FreeSVC采用增强版VITS架构,集成了说话人无关聚类(SPIN)技术和ECAPA2说话人编码器,能有效分离说话人特征与语言内容,确保跨多种语言的高质量自然音色转换。
模型特点
多语言支持
支持11种语言的零样本转换,包括中文、英语、日语等主要语言
跨语言转换能力
无需针对特定语言进行训练即可实现跨语言的歌声转换
高质量音色保持
通过SPIN技术和ECAPA2编码器有效分离说话人特征与语言内容
多样化训练数据
使用超过12个不同数据集进行训练,涵盖语音和歌唱数据
模型能力
语音转换
歌声转换
语音克隆
歌声克隆
跨语言转换
零样本学习
使用案例
音乐创作
多语言歌曲翻唱
将歌曲从一种语言转换为另一种语言,同时保持原唱歌手的音色特点
实现自然流畅的跨语言歌曲转换
虚拟歌手音色定制
为虚拟歌手创建独特的音色特征
生成具有特定音色特征的歌唱声音
语音技术研究
跨语言语音转换研究
用于研究不同语言间的语音特征转换
为语音转换技术提供研究平台
精选推荐AI模型
Qwen2.5 VL 7B Abliterated Caption It I1 GGUF
Apache-2.0
Qwen2.5-VL-7B-Abliterated-Caption-it的量化版本,支持多语言图像描述任务。
图像生成文本
Transformers 支持多种语言

Q
mradermacher
167
1
Nunchaku Flux.1 Dev Colossus
其他
Colossus Project Flux 的 Nunchaku 量化版本,旨在根据文本提示生成高质量图像。该模型在优化推理效率的同时,将性能损失降至最低。
图像生成 英语
N
nunchaku-tech
235
3
Qwen2.5 VL 7B Abliterated Caption It GGUF
Apache-2.0
这是一个基于Qwen2.5-VL-7B模型的静态量化版本,专注于图像描述生成任务,支持多种语言。
图像生成文本
Transformers 支持多种语言

Q
mradermacher
133
1
Olmocr 7B 0725 FP8
Apache-2.0
olmOCR-7B-0725-FP8是基于Qwen2.5-VL-7B-Instruct模型,使用olmOCR-mix-0225数据集微调后量化为FP8版本的文档OCR模型。
图像生成文本
Transformers 英语

O
allenai
881
3
Lucy 128k GGUF
Apache-2.0
Lucy-128k是基于Qwen3-1.7B开发的专注于代理式网络搜索和轻量级浏览的模型,在移动设备上也能高效运行。
大型语言模型
Transformers 英语

L
Mungert
263
2