CodeLLaMA-chat-13b-Chinese开源代码辅助模型，免费解答编程问题，支持多轮对话

首页

Codellama Chat 13b Chinese

由 shareAI 开发

CodeLlaMa是专为代码辅助设计的模型，擅长处理编程类问题解答，支持中英文多轮对话。

大型语言模型

Transformers

支持多种语言开源协议:Openrail #代码问答 #多轮对话 #编程助手

下载量 16

发布时间 : 8/25/2023

模型简介

基于CodeLlaMa优化的中文编程助手模型，专注于代码生成、问题解答和多轮对话场景，适用于开发者辅助编程。

模型特点

编程专项优化

相比通用中文模型，更擅长处理代码生成、调试和解释等编程相关任务

多轮对话支持

可保持长达1000 token的对话历史记忆，适合复杂编程问题讨论

中英双语能力

同时支持中文和英文的编程问题解答

模型能力

代码生成

编程问题解答

代码调试辅助

技术文档解释

多轮技术对话

使用案例

开发辅助

代码片段生成

根据自然语言描述生成可运行代码

快速实现基础功能模块

错误诊断

分析报错信息并提供解决方案

缩短调试时间

教育

编程教学助手

解释编程概念和算法原理

辅助学习者理解复杂概念

🚀 CodeLlaMa模型的中文化版本（支持多轮对话）

本项目是CodeLlaMa模型的中文化版本，支持多轮对话。CodeLlaMa专门用于代码助手，与ChineseLlaMa不同，它适用于代码类问题的回复。

🚀 快速开始

关联仓库

关联Github仓库：CodeLLaMA-chat

推理代码

用于多轮对话的推理代码如下，你可以直接复制运行，默认会自动拉取该模型权重：

# from Firefly
from transformers import AutoModelForCausalLM, AutoTokenizer
import torch


def main():
    model_name = 'shareAI/CodeLLaMA-chat-13b-Chinese'

    device = 'cuda'
    max_new_tokens = 500    # 每轮对话最多生成多少个token
    history_max_len = 1000  # 模型记忆的最大token长度
    top_p = 0.9
    temperature = 0.35
    repetition_penalty = 1.0

    model = AutoModelForCausalLM.from_pretrained(
        model_name,
        trust_remote_code=True,
        low_cpu_mem_usage=True,
        torch_dtype=torch.float16,
        device_map='auto'
    ).to(device).eval()
    tokenizer = AutoTokenizer.from_pretrained(
        model_name,
        trust_remote_code=True,
        use_fast=False
    )


    history_token_ids = torch.tensor([[]], dtype=torch.long)

    user_input = input('User：')
    while True:
        input_ids = tokenizer(user_input, return_tensors="pt", add_special_tokens=False).input_ids
        eos_token_id = torch.tensor([[tokenizer.eos_token_id]], dtype=torch.long)
        user_input_ids = torch.concat([input_ids, eos_token_id], dim=1)
        history_token_ids = torch.concat((history_token_ids, user_input_ids), dim=1)
        model_input_ids = history_token_ids[:, -history_max_len:].to(device)
        with torch.no_grad():
            outputs = model.generate(
                input_ids=model_input_ids, max_new_tokens=max_new_tokens, do_sample=True, top_p=top_p,
                temperature=temperature, repetition_penalty=repetition_penalty, eos_token_id=tokenizer.eos_token_id
            )
        model_input_ids_len = model_input_ids.size(1)
        response_ids = outputs[:, model_input_ids_len:]
        history_token_ids = torch.concat((history_token_ids, response_ids.cpu()), dim=1)
        response = tokenizer.batch_decode(response_ids)
        print("Bot：" + response[0].strip().replace(tokenizer.eos_token, ""))
        user_input = input('User：')


if __name__ == '__main__':
    main()

📄 许可证

本项目采用OpenRail许可证。

📦 相关信息

属性	详情
模型类型	CodeLlaMa模型的中文化版本
训练数据	shareAI/ShareGPT-Chinese-English-90k、shareAI/CodeChat
支持语言	中文、英文
库名称	transformers
标签	code、chat、codellama、copilot、codeAI
任务类型	question-answering