Codestral-22B-v0.1-hf开源代码处理模型 - 支持80多语言代码生成、解释与重构

首页

Codestral 22B V0.1 Hf

由 bullerwins 开发

Codestral-22B-v0.1是由Mistral AI开发的大型语言模型，支持80多种编程语言，能够执行代码生成、解释和重构等任务。

大型语言模型

Transformers

其他开源协议:其他 #多编程语言支持 #代码填充生成 #指令式代码解释

下载量 252

发布时间 : 5/29/2024

模型简介

Codestral-22B-v0.1是一个多功能编程语言模型，支持指令式查询和中间填充（FIM）功能，适用于代码生成、文档编写、代码解释和重构等多种编程相关任务。

模型特点

多语言支持

支持80多种编程语言，涵盖主流和新兴编程语言。

指令式查询

可以通过自然语言指令进行查询，适用于代码生成、解释和重构等任务。

中间填充（FIM）

支持预测前缀和后缀之间的中间标记，适用于代码补全和软件开发插件。

模型能力

代码生成

代码解释

代码重构

文档编写

代码补全

使用案例

软件开发

代码生成

根据自然语言指令生成特定功能的代码片段。

例如生成Rust函数计算斐波那契数列。

代码补全

在代码编辑器中提供智能补全功能。

例如填充函数定义的中间部分。

代码维护

代码重构

根据指令优化或重构现有代码。

代码解释

解释复杂代码片段的功能和逻辑。

🚀 Codestral-22B-v0.1模型卡片

Codestrall-22B-v0.1在包含80多种编程语言的多样化数据集上进行训练，涵盖了Python、Java、C、C++、JavaScript和Bash等最流行的语言（更多详细信息请参阅博客文章）。该模型可以通过以下方式进行查询：

指令式查询，例如回答关于代码片段的任何问题（编写文档、解释代码、代码重构）或根据特定指示生成代码。
中间填充（FIM），用于预测前缀和后缀之间的中间标记（这对于VS Code等软件开发插件非常有用）。

🚀 快速开始

2024年5月31日更新：修复了原模型更新后的分词器问题：https://huggingface.co/mistralai/Codestral-22B-v0.1/discussions/10

使用此脚本进行转换。

✨ 主要特性

支持80多种编程语言，能处理多种编程相关任务。
提供指令式查询和中间填充（FIM）两种查询方式。

📦 安装指南

建议将mistralai/Codestral-22B-v0.1与mistral-inference一起使用。

pip install mistral_inference

下载模型

from huggingface_hub import snapshot_download
from pathlib import Path

mistral_models_path = Path.home().joinpath('mistral_models', 'Codestral-22B-v0.1')
mistral_models_path.mkdir(parents=True, exist_ok=True)

snapshot_download(repo_id="mistralai/Codestral-22B-v0.1", allow_patterns=["params.json", "consolidated.safetensors", "tokenizer.model.v3"], local_dir=mistral_models_path)

💻 使用示例

基础用法

聊天功能

安装mistral_inference后，环境中会有mistral-chat命令行工具。

mistral-chat $HOME/mistral_models/Codestral-22B-v0.1 --instruct --max_tokens 256

该命令会对“用Rust编写一个计算斐波那契数列的函数”这一问题生成答案，可能如下：

Sure, here's a simple implementation of a function that computes the Fibonacci sequence in Rust. This function takes an integer `n` as an argument and returns the `n`th Fibonacci number.

fn fibonacci(n: u32) -> u32 {
    match n {
        0 => 0,
        1 => 1,
        _ => fibonacci(n - 1) + fibonacci(n - 2),
    }
}

fn main() {
    let n = 10;
    println!("The {}th Fibonacci number is: {}", n, fibonacci(n));
}

This function uses recursion to calculate the Fibonacci number. However, it's not the most efficient solution because it performs a lot of redundant calculations. A more efficient solution would use a loop to iteratively calculate the Fibonacci numbers.

中间填充（FIM）功能

安装mistral_inference并运行pip install --upgrade mistral_common以确保安装了mistral_common>=1.2：

from mistral_inference.model import Transformer
from mistral_inference.generate import generate
from mistral_common.tokens.tokenizers.mistral import MistralTokenizer
from mistral_common.tokens.instruct.request import FIMRequest

tokenizer = MistralTokenizer.v3()
model = Transformer.from_folder("~/codestral-22B-240529")

prefix = """def add("""
suffix = """    return sum"""

request = FIMRequest(prompt=prefix, suffix=suffix)

tokens = tokenizer.encode_fim(request).tokens

out_tokens, _ = generate([tokens], model, max_tokens=256, temperature=0.0, eos_id=tokenizer.instruct_tokenizer.tokenizer.eos_id)
result = tokenizer.decode(out_tokens[0])

middle = result.split(suffix)[0].strip()
print(middle)

该代码可能会输出如下内容：

num1, num2):

    # Add two numbers
    sum = num1 + num2

    # return the sum

📚 详细文档

局限性

Codestral-22B-v0.1没有任何审核机制。我们期待与社区共同探讨如何让模型更好地遵守规则，以便在需要审核输出的环境中进行部署。

📄 许可证

Codestral-22B-v0.1采用MNLP-0.1许可证发布。

🔧 技术细节

该模型由Mistral AI团队开发，团队成员包括Albert Jiang、Alexandre Sablayrolles、Alexis Tacnet等众多人员。模型在80多种编程语言的多样化数据集上进行训练，可通过指令式和中间填充（FIM）两种方式进行查询。

信息表格

属性	详情
模型类型	Codestral-22B-v0.1
训练数据	80多种编程语言的多样化数据集
许可证	MNLP-0.1

精选推荐AI模型

Llama 3 Typhoon V1.5x 8b Instruct

专为泰语设计的80亿参数指令模型，性能媲美GPT-3.5-turbo，优化了应用场景、检索增强生成、受限生成和推理任务

Cadet-Tiny是一个基于SODA数据集训练的超小型对话模型，专为边缘设备推理设计，体积仅为Cosmo-3B模型的2%左右。

Roberta Base Chinese Extractive Qa

基于RoBERTa架构的中文抽取式问答模型，适用于从给定文本中提取答案的任务。

问答系统中文

uer

2,694

智启未来，您的人工智能解决方案智库

简体中文