Llama-3-ELYZA-JP-8B开源大模型 - 免费部署增强日语交流能力

首页

Llama 3 ELYZA JP 8B

由 elyza 开发

由ELYZA公司训练的大型语言模型，基于Meta-Llama-3-8B-Instruct增强日语能力

大型语言模型

Transformers

支持多种语言#日语优化 #指令调优 #多轮对话

下载量 13.52k

发布时间 : 6/25/2024

模型简介

基于Meta Llama3构建的大型日语语言模型，通过额外预训练和指令调优优化日语处理能力，可作为日语助手使用

模型特点

日语优化

通过额外预训练和指令调优专门增强日语处理能力

多轮对话

支持系统提示和用户对话的多轮交互模式

参数高效

8B参数规模在保持性能的同时降低计算资源需求

模型能力

日语文本生成

多轮对话处理

指令跟随

英语文本生成

使用案例

办公辅助

工作灵感生成

为用户提供重拾工作热情的点子建议

可生成5个以上具体可行的建议

语言助手

日语对话助手

作为日语交流的智能助手使用

能流畅进行日语对话交流

🚀 Llama-3-ELYZA-JP-8B

Llama-3-ELYZA-JP-8B是一款由ELYZA公司训练的大语言模型。它基于meta-llama/Meta-Llama-3-8B-Instruct，通过额外的预训练和指令调优，增强了在日语场景下的使用效果。（基于Meta Llama3构建）

Llama-3-ELYZA-JP-8B-image

🚀 快速开始

若想了解更多详情，请参考我们的博客文章。

💻 使用示例

基础用法

import torch
from transformers import AutoModelForCausalLM, AutoTokenizer

DEFAULT_SYSTEM_PROMPT = "あなたは誠実で優秀な日本人のアシスタントです。特に指示が無い場合は、常に日本語で回答してください。"
text = "仕事の熱意を取り戻すためのアイデアを5つ挙げてください。"

model_name = "elyza/Llama-3-ELYZA-JP-8B"

tokenizer = AutoTokenizer.from_pretrained(model_name)
model = AutoModelForCausalLM.from_pretrained(
    model_name,
    torch_dtype="auto",
    device_map="auto",
)
model.eval()

messages = [
    {"role": "system", "content": DEFAULT_SYSTEM_PROMPT},
    {"role": "user", "content": text},
]
prompt = tokenizer.apply_chat_template(
    messages,
    tokenize=False,
    add_generation_prompt=True
)
token_ids = tokenizer.encode(
    prompt, add_special_tokens=False, return_tensors="pt"
)

with torch.no_grad():
    output_ids = model.generate(
        token_ids.to(model.device),
        max_new_tokens=1200,
        do_sample=True,
        temperature=0.6,
        top_p=0.9,
    )
output = tokenizer.decode(
    output_ids.tolist()[0][token_ids.size(1):], skip_special_tokens=True
)
print(output)

👨‍💻 开发者

按字母顺序排列。

📄 许可证

Meta Llama 3社区许可证

📚 引用方式

引用本模型

@misc{elyzallama2024,
      title={elyza/Llama-3-ELYZA-JP-8B},
      url={https://huggingface.co/elyza/Llama-3-ELYZA-JP-8B},
      author={Masato Hirakawa and Shintaro Horie and Tomoaki Nakamura and Daisuke Oba and Sam Passaglia and Akira Sasaki},
      year={2024},
}

引用相关文章

@article{llama3modelcard,
    title={Llama 3 Model Card},
    author={AI@Meta},
    year={2024},
    url = {https://github.com/meta-llama/llama3/blob/main/MODEL_CARD.md}
}