slim-sql-1b-v0开源模型 - 免费根据自然语言生成简单数据检索SQL查询

首页

Slim Sql 1b V0

由 llmware 开发

SLIM系列首个模型，专为根据自然语言提示生成简单表结构的数据检索SQL查询而设计

大型语言模型

Transformers

开源协议:Apache-2.0 #SQL生成 #自然语言转SQL #轻量级模型

下载量 67

发布时间 : 1/1/2024

模型简介

基于TinyLlama微调的专用语言指令模型，主要用于生成简单SQL查询

模型特点

高效SQL生成

专门针对简单表结构的数据检索SQL查询优化

小规模高效模型

基于1.1B参数的TinyLlama模型，在保持性能的同时减少资源消耗

结构化提示处理

采用特殊的人类/机器人标签包装器进行微调，优化提示响应

模型能力

自然语言到SQL转换

简单数据检索查询生成

聚合函数处理

使用案例

数据库查询

简单数据检索

根据自然语言问题生成SQL查询语句

在100个测试样本中达到86%准确率

聚合查询生成

生成包含COUNT等聚合函数的SQL查询

🚀 slim-sql-1b-v0模型介绍

slim-sql-1b-v0是SLIM（专用语言指令模型）系列的首个模型，能够根据自然语言提示，为简单表结构的数据检索生成准确的SQL查询。

🚀 快速开始

使用slim模型的最快方法是在transformers库中直接导入：

from transformers import AutoTokenizer, AutoModelForCausalLM  
tokenizer = AutoTokenizer.from_pretrained("slim-sql-1b-v0")  
model = AutoModelForCausalLM.from_pretrained("slim-sql-1b-v0")

请参考文件仓库中的generation_test.py文件，其中包含100个样本和测试模型的脚本。

sql-slim模型使用简单的“和包装器”进行微调，因此为了获得最佳效果，请将推理条目包装为：

full_prompt = "<human>: " + my_prompt + "\n" + "<bot>:"

提示由两部分组成：

提供表名、变量和变量类型的表创建提示。
基于文本段落的具体问题或指令。

测试样本示例：

{"context": "CREATE TABLE table_name_34 (season VARCHAR, lost VARCHAR, points VARCHAR)", "question": "Which season did the Minnesota Kicks lose 13 games and score 156 points?", "answer": "SELECT COUNT(season) FROM table_name_34 WHERE lost = 13 AND points = 156"}

此仓库中提供了一部分测试样本（"sql_test_100_simple_s"）。

如果使用HuggingFace生成脚本：

# prepare prompt packaging used in fine-tuning process
new_prompt = "<human>: " + entries["context"] + "\n" + entries["query"] + "\n" + "<bot>:"

inputs = tokenizer(new_prompt, return_tensors="pt")  
start_of_output = len(inputs.input_ids[0])

#   temperature: set at 0.3 for consistency of output
#   max_new_tokens:  set at 100 - may prematurely stop a few of the summaries

outputs = model.generate(
        inputs.input_ids.to(device),
        eos_token_id=tokenizer.eos_token_id,
        pad_token_id=tokenizer.eos_token_id,
        do_sample=True,
        temperature=0.3,
        max_new_tokens=100,
        )

output_only = tokenizer.decode(outputs[0][start_of_output:],skip_special_tokens=True)

✨ 主要特性

slim-sql-1b-v0专为根据自然语言提示，为简单表结构的数据检索生成准确的SQL查询而设计。为获得最佳效果，提示应构造成一个问题，以检索信息并对一个或多个变量执行聚合函数。

📦 安装指南

通过transformers库直接导入模型：

from transformers import AutoTokenizer, AutoModelForCausalLM  
tokenizer = AutoTokenizer.from_pretrained("slim-sql-1b-v0")  
model = AutoModelForCausalLM.from_pretrained("slim-sql-1b-v0")