🚀 冰岛语文本转语音模型
这是一个冰岛语的文本转语音模型,它基于 facebook/mms-tts-isl
模型,并使用 Talrómur 数据集进行了微调(详见 https://repository.clarin.is/repository/xmlui/handle/20.500.12537/330)。该模型能够将冰岛语文本转换为自然流畅的语音,为冰岛语的语音应用提供了强大的支持。
🚀 快速开始
本模型适用于冰岛语的文本转语音应用。以下是使用该模型的基本步骤和示例代码。
基础用法
from transformers import VitsModel, AutoTokenizer
import scipy.io.wavfile as wav
import torch
model = VitsModel.from_pretrained("Sigurdur/vits_icelandic_rosa_female_monospeaker")
tokenizer = AutoTokenizer.from_pretrained("Sigurdur/vits_icelandic_rosa_female_monospeaker")
text = "Góðan daginn! Ég heiti Rósa, ég er talgervill"
inputs = tokenizer(text, return_tensors="pt")
with torch.no_grad():
output = model(**inputs).waveform
sampling_rate = getattr(sampling_rate, "sampling_rate", 16000)
if not (0 <= sampling_rate <= 65535):
raise ValueError(f"Invalid sampling rate: {sampling_rate}")
waveform = output.squeeze().cpu().numpy()
保存输出到文件
wav.write("output.wav", rate=sampling_rate, data=waveform)
在 Jupyter Notebook 中查看
from IPython.display import Audio
Audio(output, rate=sampling_rate)
✨ 主要特性
📚 详细文档
模型详情
这是一个 🤗 Transformers 模型的卡片,该模型已被推送到 Hugging Face Hub,此模型卡片是自动生成的。
用途
本模型专为冰岛语的文本转语音应用而设计。
偏差、风险和局限性
目前关于模型的偏差、风险和局限性的信息不足,需要更多的研究和数据来进一步明确。建议用户(直接用户和下游用户)了解模型可能存在的风险、偏差和局限性。
训练数据
目前关于训练数据的详细信息不足,需要更多的研究和数据来进一步明确。
训练超参数
评估
目前关于模型评估的测试数据、评估因素和评估指标的详细信息不足,需要更多的研究和数据来进一步明确。
环境影响
可以使用 Lacoste 等人(2019) 提出的 机器学习影响计算器 来估算碳排放。目前关于硬件类型、使用时长、云服务提供商、计算区域和碳排放的详细信息不足,需要更多的研究和数据来进一步明确。
技术规格
目前关于模型架构和目标、计算基础设施(硬件和软件)的详细信息不足,需要更多的研究和数据来进一步明确。
引用
目前关于模型引用的 BibTeX 和 APA 信息不足,需要更多的研究和数据来进一步明确。
术语表
目前关于模型相关术语和计算的详细信息不足,需要更多的研究和数据来进一步明确。
更多信息
目前关于模型的更多详细信息不足,需要更多的研究和数据来进一步明确。
模型卡片作者
Sigurdur Haukur Birgisson
模型卡片联系方式
如需联系作者,请通过领英:Sigurdur Haukur Birgisson 。