许可协议: cc-by-sa-4.0
语言:
- 日语
任务标签: 文本转语音
标签:
- style-bert-vits2
- style-bert-vits2-jp-extra
- tts
- 童声
- 童声音色
- 日语
- 文本转音频
- 文本到音频
- 音频
X(推特)账号 欢迎来互动交流。

本模型的优势在于可免费自由生成稚嫩舒缓的童声,商用与非商用场景皆适用。
The advantage of this model is that you can freely use the childish and unapologetic voice generation for free, both commercial and non-commercial.
此模型为RikkaBotan的冷静版本,特别适合说明性文本的朗读。
如需更具情感表现力的版本,请尝试甜美版
需要英语发音请使用英语版
需要耳语效果请使用ASMR版
需要中文发音请使用中文版
样本语音/sample voice
样本语音①
样本语音②
模型说明/model description
本模型是基于style_bert_vits2_jp_extra框架、使用自有语音数据训练的TTS(文本转语音)模型。
作为专为日语优化的语音生成模型,其合成效果在自然度和准确度上较前代模型有显著提升。
因训练数据仅来自模型研发者本人录音,遵循与style_bert_vits2_jp_extra相同的开源协议,允许免费商用及非商用。
使用条款/limitation
〇允许事项
- 成品编辑加工
- 商用用途
- 作为学习素材使用
- R-18/R-18G内容创作(需设置年龄分级)
×禁止事项
- 语音模型二次分发
- 人身攻击行为
- 政治/宗教立场宣传
- 无分级限制发布成人内容
- 冒用身份等损害开发者权益的行为
配套商用VRM模型/VRM(Vroid) model for commercial use
适用于虚拟主播及视频解说等场景
VRM模型下载
温馨请求/If you like
在X(推特)或作品说明中标注模型来源会让开发者倍感鼓舞(非强制要求)
使用方法/how to use(Google Colab代码)
方式一:使用style-bert-vits2应用
from google.colab import drive
drive.mount("/content/drive")
%cd /content/drive/MyDrive/
!mkdir Style-Bert-VITS2/
%cd Style-Bert-VITS2/
!mkdir model_assets/
%cd model_assets/
!mkdir rikka_botan/
from huggingface_hub import snapshot_download
model_name = "RikkaBotan/style_bert_vits2_jp_extra_cool_original"
download_path = snapshot_download(
repo_id=model_name,
local_dir = f"rikka_botan/",
local_dir_use_symlinks=False
)
!git clone https://github.com/litagin02/Style-Bert-VITS2.git
%cd Style-Bert-VITS2/
!pip install -r requirements.txt
!python initialize.py --skip_jvnv
from google.colab import drive
drive.mount("/content/drive")
dataset_root = "/content/drive/MyDrive/Style-Bert-VITS2/Data"
assets_root = "/content/drive/MyDrive/Style-Bert-VITS2/model_assets"
import yaml
with open("configs/paths.yml", "w", encoding="utf-8") as f:
yaml.dump({"dataset_root": dataset_root, "assets_root": assets_root}, f)
!python app.py --share
方式二:直接调用API
!git clone https://github.com/litagin02/Style-Bert-VITS2.git
%cd Style-Bert-VITS2/
!pip install -r requirements.txt
!pip install style-bert-vits2 --no-build-isolation
from style_bert_vits2.nlp import bert_models
from style_bert_vits2.constants import Languages
bert_models.load_model(Languages.JP, "ku-nlp/deberta-v2-large-japanese-char-wwm")
bert_models.load_tokenizer(Languages.JP, "ku-nlp/deberta-v2-large-japanese-char-wwm")
from pathlib import Path
from huggingface_hub import hf_hub_download
model_file = "rikka_botan_cool.safetensors"
config_file = "config.json"
style_file = "style_vectors.npy"
for file in [model_file, config_file, style_file]:
hf_hub_download(
"RikkaBotan/style_bert_vits2_jp_extra_cool_original",
file,
local_dir="model_assets"
)
from style_bert_vits2.tts_model import TTSModel
assets_root = Path("model_assets")
model = TTSModel(
model_path=assets_root / model_file,
config_path=assets_root / config_file,
style_vec_path=assets_root / style_file,
device="cuda"
)
from IPython.display import Audio, display
sr, audio = model.infer(text="在此输入日文文本")
display(Audio(audio, rate=sr))
致谢/Acknowledgments
特别感谢litagin开发style-bert-vits2-jp-extra框架
本模型凝聚了众多研究者的智慧结晶,谨向所有先驱者致以崇高敬意