Ko-Llama-3-8B-Instruct开源韩语模型 - 免费提升韩语语言处理性能

首页

Ko Llama 3 8B Instruct

由 davidkim205 开发

Ko-Llama-3-8B-Instruct 是一个专为提升韩语语言模型性能而开发的模型，基于 Meta-Llama-3-8B-Instruct 进行监督微调。

大型语言模型

Transformers

支持多种语言#韩语优化 #拒绝采样训练 #多轮对话

下载量 140

发布时间 : 6/12/2024

模型简介

该模型通过拒绝采样技术创建数据集，并经过监督微调训练，旨在优化韩语文本生成任务。

模型特点

韩语优化

专为韩语文本生成任务优化，提升韩语语言模型性能。

拒绝采样技术

采用拒绝采样技术创建数据集，提高数据质量。

监督微调

通过监督微调（Supervised Fine Tuning）进行训练，优化模型表现。

模型能力

韩语文本生成

英语文本生成

多轮对话

使用案例

聊天机器人

韩语聊天机器人

可用于构建韩语聊天机器人，提供具体的回答。

示例输出显示模型能够理解并生成韩语回答。

文本生成

多义词解释

能够生成多义词在不同语境下的解释。

示例中展示了'苹果'一词的多义性解释。

🚀 davidkim205/Ko-Llama-3-8B-Instruct

Ko-Llama-3-8B-Instruct是为提升韩语语言模型性能而研究的多个模型之一。该模型采用拒绝采样（REJECTION SAMPLING）技术创建数据集，然后通过监督微调（Supervised Fine Tuning）进行训练。

🚀 快速开始

安装依赖

如果出现以下未定义符号错误，请按如下方式安装torch：

...
RuntimeError: Failed to import transformers.models.llama.modeling_llama because of the following error (look up to see its traceback):
/home/david/anaconda3/envs/spaces/lib/python3.10/site-packages/flash_attn_2_cuda.cpython-310-x86_64-linux-gnu.so: undefined symbol: _ZN3c104cuda9SetDeviceEi

pip install torch==2.2.0
pip install flash-attn==2.5.9.post1

使用示例

from transformers import AutoTokenizer, AutoModelForCausalLM
import torch

model_id = "davidkim205/Ko-Llama-3-8B-Instruct"

tokenizer = AutoTokenizer.from_pretrained(model_id)
model = AutoModelForCausalLM.from_pretrained(
    model_id,
    torch_dtype=torch.bfloat16,
    device_map="auto",
)

while True:
    prompt = input('>')
    messages = [
        {"role": "system", "content": "당신은 구체적으로 답변하는 챗봇입니다."},
        {"role": "user", "content": prompt},
    ]
    input_ids = tokenizer.apply_chat_template(
        messages,
        add_generation_prompt=True,
        return_tensors="pt"
    ).to(model.device)

    terminators = [
        tokenizer.eos_token_id,
        tokenizer.convert_tokens_to_ids("<|eot_id|>")
    ]

    outputs = model.generate(
        input_ids,
        max_new_tokens=1024,
        eos_token_id=terminators,
        do_sample=True,
        temperature=0.6,
        top_p=0.9,
    )
    response = outputs[0][input_ids.shape[-1]:]
    print(tokenizer.decode(response, skip_special_tokens=True))

以下是一个询问“사과的含义”的示例及输出：

사과의 의미를 설명하시오
The attention mask and the pad token id were not set. As a consequence, you may observe unexpected behavior. Please pass your input's `attention_mask` to obtain reliable results.
Setting `pad_token_id` to `eos_token_id`:128009 for open-end generation.
사과는 일반적으로 맛과 영양가 있는 과일로 알려져 있습니다. 사과는 신선한 상태에서 주로 먹거나, 요거트나 스무디 등의 음료에 혼합하여 섭취되기도 합니다. 또한, 사과는 다양한 종류가 있으며, 각각의 종류는 다른 색상과 맛을 가지고 있습니다.

사과는 과일이지만, 종종 다른 의미로도 사용됩니다. 예를 들어, "사과"라는 단어는 어떤 것이 잘못되거나 부족한 것을 시사하는 상황에서 사용될 수도 있습니다. 예를 들어, "사과"를 주는 것은 잘못된 행동이나 부족한 사고로 인한 사과를 의미할 수 있습니다.

또한, "사과"는 어떤 상황에서 다른 사람에게서 사과를 받는 것을 의미하기도 합니다. 예를 들어, "사과"를 구하지 않으면 어떤 상황에서 다른 사람에게서 사과를 받지 못할 수도 있습니다.

따라서, "사과"는 다양한 의미로 사용되는 단어이며, 맥락에 따라 다른 의미를 가질 수 있습니다.

📚 详细文档

模型详情

属性	详情
模型开发者	davidkim(장연 김)
仓库	-
基础模型	meta-llama/Meta-Llama-3-8B-Instruct
SFT数据集	sft_rs_140k

基准测试

kollm_evaluation

https://github.com/davidkim205/kollm_evaluation

任务	准确率
平均	0.47
kobest	0.54
kobest_boolq	0.57
kobest_copa	0.62
kobest_hellaswag	0.42
kobest_sentineg	0.57
kobest_wic	0.49
ko_truthfulqa	0.29
ko_mmlu	0.34
ko_hellaswag	0.36
ko_common_gen	0.76
ko_arc_easy	0.33