Llama-3-8B-Instruct-Ja开源模型 - 免费商用，支持日语问答与对话

首页

Llama 3 8B Instruct Ja

由 alfredplpl 开发

针对Llama 3进行日语化的模型，允许商业用途，支持日语问答和对话

大型语言模型

Transformers

支持多种语言开源协议:其他 #日语指令微调 #多轮对话优化 #商业可用

下载量 78

发布时间 : 4/22/2024

模型简介

基于Meta-Llama-3-8B-Instruct进行日语优化的语言模型，专门针对日语问答和对话任务进行了微调

模型特点

日语优化

专门针对日语进行了指令微调，能够流畅地进行日语问答和对话

商业用途许可

遵循Llama 3许可证，允许商业用途

高效训练

采用LoRA微调方法，在有限计算资源下实现高效训练

模型能力

日语文本生成

日语问答系统

多轮对话

指令跟随

使用案例

客户服务

日语客服助手

用于处理日语客户的咨询和问题解答

能够理解并流畅回答日语客户的问题

教育

日语学习助手

帮助日语学习者练习对话和回答问题

提供自然的日语对话体验

🚀 面向日语的Llama 3 8B

本项目旨在将Llama 3模型进行日语适配。项目于4月23日更新，建议您重新下载使用。

🚀 快速开始

若想快速体验，可使用演示。其次，推荐使用Colab。若要在本地运行，请按以下步骤操作：

📦 安装指南

首先，安装所需库：

pip install -U transformers accelerate

💻 使用示例

基础用法

安装完成后，运行以下代码：

import torch
from transformers import AutoTokenizer, AutoModelForCausalLM

tokenizer = AutoTokenizer.from_pretrained("alfredplpl/Llama-3-8B-Instruct-Ja")
model = AutoModelForCausalLM.from_pretrained("alfredplpl/Llama-3-8B-Instruct-Ja", device_map="auto", torch_dtype=torch.bfloat16)

# プロンプトの準備
messages = [
    {
        'role': "system",
        'content': "あなたは日本語で回答するAIアシスタントです。"
    },
    {
        'role': "user",
        'content': "猫と犬、どっちが好き？"
    }
]
prompt=tokenizer.apply_chat_template(messages, tokenize=False)

# 推論の実行
input_ids = tokenizer(prompt, return_tensors="pt").to(model.device)
outputs = model.generate(
    **input_ids,
    max_new_tokens=128,
    do_sample=True,
    top_p=0.95,
    temperature=0.2,
    repetition_penalty=1.1,
    eos_token_id=[
        tokenizer.eos_token_id,
        tokenizer.convert_tokens_to_ids("<|eot_id|>")
    ],
)
print(tokenizer.decode(outputs[0]))

运行上述代码后，预期会得到如下结果：

<|begin_of_text|><|start_header_id|>system<|end_header_id|>

あなたは日本語で回答するAIアシスタントです。<|eot_id|><|start_header_id|>user<|end_header_id|>

猫と犬、どっちが好き？<|eot_id|><|start_header_id|>assistant<|end_header_id|>

猫と犬の両方を飼っているので、どちらも好きだ！<|eot_id|>

📚 详细文档

训练数据

llm-jp/databricks-dolly-15k-ja
cl-nagoya/auto-wiki-qa
meta-llama/Meta-Llama-3-8B-Instruct

训练方法

对meta-llama/Meta-Llama-3-8B-Instruct模型，使用cl-nagoya/auto-wiki-qa中的约240万条训练数据，通过LoRA进行1个epoch的指令微调，并合并LoRA。之后，再使用llm-jp/databricks-dolly-15k-ja数据进行5个epoch的LoRA指令微调，并合并LoRA。所有训练均采用有监督学习。