ArrowMint-Gemma3-4B-YUKI-v0.1开源日语模型 - 为AI虚拟主播对话量身优化

首页

Arrowmint Gemma3 4B YUKI V0.1

由 DataPilot 开发

专为AI虚拟主播（AI VTuber）对话优化的日语语言模型，基于Google的gemma-3-4b-it开发

大型语言模型

Safetensors

支持多种语言#AI虚拟主播 #日语对话优化 #多轮对话

下载量 73

发布时间 : 3/29/2025

模型简介

针对AI虚拟主播需求优化的语言模型，具备多轮对话、指令遵循和轻量化特点，支持日语和英语

模型特点

AI虚拟主播优化

专门为AI虚拟主播对话场景优化，具备自然的多轮对话能力

指令遵循能力

能严格遵守用户指示和角色设定(prompt)，生成连贯响应

轻量化设计

模型尺寸和推理速度优化，适合实时响应和有限资源环境

多模型融合

通过mergekit工具融合多个专项模型，整合各模型优势

模型能力

多轮对话

指令遵循

角色扮演

日语文本生成

英语文本生成

图像描述

使用案例

虚拟主播

AI VTuber互动

作为虚拟主播的AI核心，与观众进行自然流畅的对话互动

能维持长时间对话流并保持角色设定

情感支持

情绪安抚

当用户情绪低落时提供鼓励和支持

能识别情绪并生成恰当的支持性回应

🚀 DataPilot/ArrowMint-Gemma3-4B-YUKI-v0.1

本模型以Google的google/gemma-3-4b-it为基础模型进行开发，专门针对AItuber（AI虚拟主播）的对话能力进行了优化，能在多轮对话、遵循用户指令和轻量化运行等方面表现出色，为用户带来高效且自然的交互体验。

🚀 快速开始

本模型以Google的google/gemma-3-4b-it为基础模型，专为提升AItuber（AI虚拟主播）的对话能力而开发。通过使用Unsloth进行高效微调，并结合合成数据集创建多个特化模型，最终利用mergekit合并这些模型，旨在融合各模型优势，打造高性能的语言模型。

✨ 主要特性

AItuber的核心（AI）尤其需要以下性能：

多轮对话性能：具备长时间维持自然对话流程的能力。
指令遵循性能：能够忠实遵循用户的指示和角色设定（指令），生成连贯一致的回复。
轻量化：模型尺寸和推理速度满足实时回复生成需求，可在有限资源环境下运行。

ArrowMint-Gemma3-4B-YUKI-v0.1正是为满足这些性能要求而设计开发的。

📦 安装指南

首先，安装所需的库。Gemma 3需要transformers 4.50.0及以上版本。

pip install -U transformers accelerate Pillow 
# 仅使用CPU或特定环境下，vllm的安装方式可能不同。
# 请参考vLLM官方文档：https://docs.vllm.ai/en/latest/getting_started/installation.html

💻 使用示例

基础用法

带图像推理

from transformers import AutoProcessor, Gemma3ForConditionalGeneration
from PIL import Image
import requests
import torch

model_id = "DataPilot/ArrowMint-Gemma3-4B-YUKI-v0.1"

model = Gemma3ForConditionalGeneration.from_pretrained(
    model_id, device_map="auto"
).eval()

processor = AutoProcessor.from_pretrained(model_id)

messages = [
    {
        "role": "system",
        "content": [{"type": "text", "text": "你是一位友善且有点迷糊的AI助手「Yuki」。请支持用户，偶尔说些笑话来缓和气氛。如果用户情绪低落，请给予鼓励。"}]
    },
    {
        "role": "user",
        "content": [
            {"type": "image", "image": "https://web.archive.org/web/20250331074254/https://www.nsozai.jp/photos/2013/10/08/img/DSC_0176_p.jpg"},
            {"type": "text", "text": "这张图片很不错吧？感觉能让人感受到春天和希望..."}
        ]
    }
]

inputs = processor.apply_chat_template(
    messages, add_generation_prompt=True, tokenize=True,
    return_dict=True, return_tensors="pt"
).to(model.device, dtype=torch.bfloat16)

input_len = inputs["input_ids"].shape[-1]

with torch.inference_mode():
    generation = model.generate(**inputs, max_new_tokens=100, do_sample=False)
    generation = generation[0][input_len:]

decoded = processor.decode(generation, skip_special_tokens=True)
print(decoded)

无图像推理

from transformers import AutoProcessor, Gemma3ForConditionalGeneration
import torch

model_id = "DataPilot/ArrowMint-Gemma3-4B-YUKI-v0.1"

model = Gemma3ForConditionalGeneration.from_pretrained(
    model_id, device_map="auto"
).eval()

processor = AutoProcessor.from_pretrained(model_id)

messages = [
    {
        "role": "system",
        "content": [{"type": "text", "text": "你是一位友善且有点迷糊的AI助手「Yuki」。请支持用户，偶尔说些笑话来缓和气氛。如果用户情绪低落，请给予鼓励。"}]
    },
    {
        "role": "user",
        "content": [
            {"type": "text", "text": "今天工作好累啊。请给我推荐5种缓解疲劳的方法。"}
        ]
    }
]

inputs = processor.apply_chat_template(
    messages, add_generation_prompt=True, tokenize=True,
    return_dict=True, return_tensors="pt"
).to(model.device, dtype=torch.bfloat16)

input_len = inputs["input_ids"].shape[-1]

with torch.inference_mode():
    generation = model.generate(**inputs, max_new_tokens=100, do_sample=False)
    generation = generation[0][input_len:]

decoded = processor.decode(generation, skip_special_tokens=True)
print(decoded)

📚 详细文档

本模型使用以下mergekit配置文件创建：

merge_method: model_stock

base_model: unsloth/gemma-3-4b-it

models:
  - model: DataPilot/ArrowMint-Gemma3-4B-ChocoMint-code
  - model: DataPilot/ArrowMint-Gemma3-4B-ChocoMint-jp
  - model: DataPilot/ArrowMint-Gemma3-4B-ChocoMint-instruct-v0.1
  - model: DataPilot/ArrowMint-Gemma3-4B-ChocoMint-instruct-v0.2

dtype: bfloat16

pad_to_multiple_of: 512
tokenizer_source: base

name: gemma3-4b-ft # 合并时的内部名称