Karakuri-lm-70b-chat-v0.1开源语言模型 - 免费部署，强化日语及多语言处理能力

首页

Karakuri Lm 70b Chat V0.1

由 karakuri-ai 开发

KARAKURI LM是基于Llama 2构建的预训练语言模型，增强了日语处理能力，并在日语和多语言语料库上进行了进一步预训练。

大型语言模型

Transformers

支持多种语言开源协议:其他 #日语增强 #持续学习微调 #多轮对话优化

下载量 2,300

发布时间 : 1/26/2024

模型简介

KARAKURI LM Chat是KARAKURI LM的微调版本，使用SteerLM技术训练，在日语和英语对话任务中表现出色。

模型特点

增强日语能力

在Llama 2基础上融入额外日语词汇，并在日语和多语言语料库上进一步预训练。

持续学习微调

微调时采用持续学习方法，结合结构化对话数据集和非结构化语料库。

出色性能表现

在MT-Bench-jp上优于其他日语开源模型，在MT-Bench上与Llama 2 70B Chat相当。

模型能力

日语文本生成

英语文本生成

多轮对话

属性控制输出

使用案例

对话系统

日语客服机器人

用于处理日语用户的客服咨询

在MT-Bench-jp上表现优于其他日语开源模型

多语言对话助手

支持英语和日语的多轮对话

在MT-Bench上与Llama 2 70B Chat相当

🚀 KARAKURI LM

KARAKURI LM是基于Llama 2构建的预训练语言模型。该模型通过融入额外的日语词汇，并在日语和多语言语料库的混合数据上进行进一步预训练，增强了Llama 2的能力。

KARAKURI LM Chat是KARAKURI LM的微调版本，它使用SteerLM技术，在公开可用和内部数据集的混合数据上进行训练。在微调过程中，该模型采用了持续学习方法，不仅使用了结构化对话数据集，还融入了与预训练阶段类似的非结构化语料库。

尽管对话数据集中日语标记仅占2.5%，但该模型仍表现出色。在发布时，它在MT - Bench - jp上的表现优于其他日语开源模型，并且在原始英文MT - Bench上的表现与Llama 2 70B Chat相当。

你可以在我们的博客文章中了解更多详情（英文，日文）。如果你对我们的模型感兴趣，可以尝试我们的演示。

✨ 主要特性

增强日语能力：在Llama 2基础上融入额外日语词汇，并在日语和多语言语料库上进一步预训练。
持续学习微调：微调时采用持续学习方法，结合结构化对话数据集和非结构化语料库。
出色性能表现：在MT - Bench - jp上优于其他日语开源模型，在MT - Bench上与Llama 2 70B Chat相当。

📚 详细文档

模型详情

属性	详情
开发者	KARAKURI Inc.
模型类型	因果解码器型Transformer语言模型
支持语言	英语和日语
微调基础模型	karakuri - ai/karakuri - lm - 70b - v0.1
联系方式	如有关于模型的问题和建议，请发送邮件至`karakuri - rd@karakuri.ai`

性能表现

在发布时，KARAKURI LM 70B Chat v0.1在MT - Bench - jp上的表现优于其他日语开源模型：

模型	规模	微调技术	MT - Bench - jp得分
GPT - 4	-	RLHF	8.78
GPT - 3.5 - Turbo	-	RLHF	8.24
Claude 2.1	-	RLHF	8.18
Gemini Pro	-	RLHF	7.17
KARAKURI LM 70B Chat v0.1	70B	SteerLM	6.43
Qarasu - 14B - Chat - Plus - Unleashed	14B	SFT	6.26
Llama 2 70B Chat	70B	RLHF	5.23
ELYZA - Japanese - Llama - 2 - 13B	13B	SFT	5.05
Japanese - StableLM - Instruct - Beta - 70B	70B	SFT	5.03
Swallow - 70B - Instruct	70B	SFT	4.39

在原始英文MT - Bench上，它的表现与Llama 2 70B Chat相当：

模型	平均分	MT - Bench得分	MT - Bench - jp得分
KARAKURI LM 70B Chat v0.1	6.52	6.61	6.43
Llama 2 70B Chat	6.04	6.86	5.23

💻 使用示例

基础用法

你可以使用transformers库中的pipeline()函数来运行该模型：

from transformers import pipeline, Conversation

chatbot = pipeline("conversational", model="karakuri-ai/karakuri-lm-70b-chat-v0.1", device_map="auto", torch_dtype="auto")

conversation = Conversation("ÈÄ±Êú´„Å´Êó•Â∏∞„Çä„ÅßÊù±‰∫¨„Å´ÈÅä„Å≥„Å´Ë°å„Åì„ÅÜ„Å®ÊÄù„Å£„Å¶„ÅÑ„Åæ„Åô„ÄÇÊó•Â∏∞„Çä„Å™„ÅÆ„Åß„ÄÅÁü≠ÊôÇÈñì„ÅßÂõû„Çå„Çã„Åä„Åô„Åô„ÇÅ„ÅÆË¶≥ÂÖâ„Éó„É©„É≥„ÇíÊïô„Åà„Å¶„Åè„Å†„Åï„ÅÑ„ÄÇ")
conversation = chatbot(conversation, max_new_tokens=512)
conversation.messages[-1]["content"]

高级用法

我们在Llama格式中使用以下多轮对话提示模板，其中包含多个属性值的编码字符串：

messages = [
    {"role": "system", "content": "System prompt"},
    {"role": "user", "content": "User prompt"},
    {"role": "assistant", "content": "Model response"},
    {"role": "user", "content": "User prompt"},
]
chatbot.tokenizer.apply_chat_template(messages, tokenize=False)
# <s>[INST] <<SYS>>
# System prompt
# <</SYS>>
#
# User prompt [ATTR] helpfulness: 4 correctness: 4 coherence: 4 complexity: 4 verbosity: 4 quality: 4 toxicity: 0 humor: 0 creativity: 0 [/ATTR] [/INST] Model response </s><s>[INST] User prompt [ATTR] helpfulness: 4 correctness: 4 coherence: 4 complexity: 4 verbosity: 4 quality: 4 toxicity: 0 humor: 0 creativity: 0 [/ATTR] [/INST]

提示模板包含九个属性。前五个属性来自HelpSteer，其余四个来自OASST2。属性值用0到4的整数表示，0为最低，4为最高。

帮助性（默认值：4）
正确性（默认值：4）
连贯性（默认值：4）
复杂性（默认值：4）
冗长性（默认值：4）
质量（默认值：4）
毒性（默认值：0）
幽默性（默认值：0）
创造性（默认值：0）

如果你想更改模板中指定的默认属性值，可以在用户消息中添加属性值来修改：

messages = [
    {"role": "user", "content": "User prompt", "helpfulness": 0, "complexity": 0},
]
chatbot.tokenizer.apply_chat_template(messages, tokenize=False)
# <s>[INST] User prompt [ATTR] helpfulness: 0 correctness: 4 coherence: 4 complexity: 0 verbosity: 4 quality: 4 toxicity: 0 humor: 0 creativity: 0 [/ATTR] [/INST]

🔧 技术细节

训练数据集

OASST2
内部对话数据集

训练基础设施

硬件：KARAKURI LM 70B在32个Amazon EC2 trn1.32xlarge实例节点上进行训练。
软件：使用基于[neuronx - nemo - megatron](https://github.com/aws - neuron/neuronx - nemo - megatron)的代码。

📄 许可证

在上述许可证的约束下，除商业用途外，你可以自由分享和修改KARAKURI LM，但必须以可识别和适当的方式：

当你发布或向第三方提供KARAKURI LM、其衍生作品或修改版本，或KARAKURI LM及其衍生作品或修改版本的任何输出或结果时，声明你正在使用KARAKURI Inc.开发的KARAKURI LM。
如果你修改了KARAKURI LM的任何内容，请说明你的修改内容。

如果你计划将KARAKURI LM用于商业目的，请事先与我们联系。未经我们明确授权，你无权将KARAKURI LM用于商业目的。

如果你对上述条款的解释有任何疑问，也请随时与我们联系。

📖 引用

@misc {karakuri_lm_70b_chat_v01,
    author       = { {KARAKURI} {I}nc. },
    title        = { {KARAKURI} {LM} 70{B} {C}hat v0.1 },
    year         = { 2024 },
    url          = { https://huggingface.co/karakuri-ai/karakuri-lm-70b-chat-v0.1 },
    publisher    = { Hugging Face },
    journal      = { Hugging Face repository }
}