smallcloudai-Refact-1_6B-fim-gguf开源代码生成模型

首页

Smallcloudai Refact 1 6B Fim Gguf

由 maddes8cht 开发

Refact-1.6B是一个1.6B参数的代码生成模型，在多语言代码补全和对话任务中表现优异，特别适合IDE集成。

大型语言模型支持多种语言开源协议:Openrail #多语言代码补全 #填充中间生成 #IDE智能辅助

下载量 70

发布时间 : 11/29/2023

模型简介

专注于代码填充中间(FIM)和对话功能的语言模型，支持多种编程语言，在HumanEval等基准测试中超越同类3B参数模型。

模型特点

卓越的代码补全能力

在HumanEval测试中pass@1达到32%，超越同类3B参数模型

填充中间(FIM)功能

专门优化了在代码中间位置进行智能补全的能力

对话功能支持

支持编程相关的问答对话，表现优于专门优化的对话模型

多语言代码支持

支持Python、JavaScript、Java、C++等多种编程语言

高效推理

采用多查询注意力等优化技术，实现快速推理

模型能力

代码自动补全

编程问答

多语言代码生成

代码填充中间补全

技术文档理解

使用案例

开发工具集成

IDE智能补全

集成到开发环境中提供实时代码建议

显著提升开发效率，减少编码错误

编程教育

编程学习助手

解答编程问题并给出示例代码

帮助学习者理解编程概念和实践

代码生成

函数级代码生成

根据函数签名和注释生成实现代码

HumanEval pass@1达到32%

🚀 Refact-1.6B-fim - GGUF

Refact-1.6B-fim - GGUF是一款代码生成模型，在代码补全和聊天交互方面表现出色。它在多个代码评估指标上超越了同类型模型，且支持多语言，可在IDE中为开发者提供高效的代码补全服务。

🚀 快速开始

你可以通过下载Refact插件立即开始使用该模型，也可以使用开源Docker容器自行托管模型。

代码补全示例

# pip install -q transformers
from transformers import AutoModelForCausalLM, AutoTokenizer

checkpoint = "smallcloudai/Refact-1_6B-fim"
device = "cuda" # for GPU usage or "cpu" for CPU usage

tokenizer = AutoTokenizer.from_pretrained(checkpoint)
model = AutoModelForCausalLM.from_pretrained(checkpoint, trust_remote_code=True).to(device)

prompt = '<fim_prefix>def print_hello_world():\n    """<fim_suffix>\n    print("Hello world!")<fim_middle>'

inputs = tokenizer.encode(prompt, return_tensors="pt").to(device)
outputs = model.generate(inputs, max_length=100, temperature=0.2)
print("-"*80)
print(tokenizer.decode(outputs[0]))

聊天交互示例

prompt_template = "<empty_output>SYSTEM {system}\n" \
                  "<empty_output>USER {query}\n" \
                  "<empty_output>ASSISTANT"
prompt = prompt_template.format(system="You are a programming assistant",
                                query="How do I sort a list in Python?")

✨ 主要特性

高性能：经过在生成数据上的微调，该模型在HumanEval等指标上超越了Replit 3b、Stability Code 3b等模型，几乎超越了比它大十倍的StarCoder模型。
多语言支持：支持多种编程语言，可在不同的编程场景中使用。
聊天功能：除了代码补全，该模型还能作为聊天机器人，在聊天交互中表现良好。

📦 安装指南

暂未提供相关安装步骤。

💻 使用示例

基础用法

# pip install -q transformers
from transformers import AutoModelForCausalLM, AutoTokenizer

checkpoint = "smallcloudai/Refact-1_6B-fim"
device = "cuda" # for GPU usage or "cpu" for CPU usage

tokenizer = AutoTokenizer.from_pretrained(checkpoint)
model = AutoModelForCausalLM.from_pretrained(checkpoint, trust_remote_code=True).to(device)

prompt = '<fim_prefix>def print_hello_world():\n    """<fim_suffix>\n    print("Hello world!")<fim_middle>'

inputs = tokenizer.encode(prompt, return_tensors="pt").to(device)
outputs = model.generate(inputs, max_length=100, temperature=0.2)
print("-"*80)
print(tokenizer.decode(outputs[0]))

高级用法

prompt_template = "<empty_output>SYSTEM {system}\n" \
                  "<empty_output>USER {query}\n" \
                  "<empty_output>ASSISTANT"
prompt = prompt_template.format(system="You are a programming assistant",
                                query="How do I sort a list in Python?")

📚 详细文档

模型信息

属性	详情
模型类型	Refact-1.6B-fim
训练数据	书籍、arxiv论文、C4数据集、falcon-refinedweb、维基百科、GitHub问题、Stack Markdown、宽松许可的GitHub代码自制数据集、bigcode/the-stack-dedup、rombodawg/2XUNCENSORED_MegaCodeTraining188k、bigcode/commitpackft
评估指标	code_eval
库名称	transformers

模型性能

任务	数据集	指标	值
文本生成	openai_humaneval (HumanEval)	pass@1 (T=0.01)	32.0
文本生成	openai_humaneval (HumanEval)	pass@1 (T=0.2)	31.5
文本生成	openai_humaneval (HumanEval)	pass@10 (T=0.8)	53.0
文本生成	openai_humaneval (HumanEval)	pass@100 (T=0.8)	76.9
文本生成	bigcode/humanevalpack (HumanEvalSynthesize Python)	pass@1 (T=0.2)	35.8
文本生成	bigcode/humanevalpack (HumanEvalSynthesize JavaScript)	pass@1 (T=0.2)	31.6
...	...	...	...