ChessGPT-chat-v1开源对话模型 - 免费部署，专注国际象棋领域问答

首页

Chessgpt Chat V1

由 Waterhorse 开发

基于Chessgpt-Base-v1进行监督微调(SFT)的28亿参数对话模型，专注于国际象棋领域

大型语言模型

Transformers

英语开源协议:Apache-2.0 #国际象棋对话 #28亿参数 #策略学习

下载量 218

发布时间 : 6/3/2023

模型简介

专攻国际象棋领域的对话语言模型，支持国际象棋相关问题的交流与解答

模型特点

国际象棋专业领域优化

针对国际象棋领域进行专门训练，能够理解和生成国际象棋相关内容

对话能力

支持多轮对话交互，能够理解并回应国际象棋相关问题

开源许可

采用Apache 2.0许可协议，允许商业和研究使用

模型能力

国际象棋知识问答

国际象棋开局分析

国际象棋术语解释

多轮对话交互

使用案例

国际象棋学习

开局分析

回答关于国际象棋开局的问题

能够准确识别并解释常见开局如西西里防御

棋局讨论

参与关于特定棋局的讨论

AI研究

策略学习研究

用于研究语言模型在策略学习领域的应用

🚀 国际象棋GPT聊天版v1

国际象棋GPT聊天版v1是国际象棋GPT基础版v1经过监督微调（SFT）的模型。它能为国际象棋相关的研究和应用提供更精准的语言交互能力，推动国际象棋领域的智能化发展。

基础模型：国际象棋GPT基础版v1
聊天版本：国际象棋GPT聊天版v1

此外，我们正在积极开发下一代模型国际象棋GPT - V2。欢迎各方贡献，特别是在国际象棋相关数据集方面。如有相关事宜，请联系 xidong.feng.20@ucl.ac.uk。

✨ 主要特性

模型类型：语言模型
支持语言：英语
许可证：Apache 2.0
模型描述：一个具有28亿参数的国际象棋预训练语言模型。

📦 安装指南

此模型推理需要一个显存为8GB的GPU。

import torch
import transformers
from transformers import AutoTokenizer, AutoModelForCausalLM

MIN_TRANSFORMERS_VERSION = '4.25.1'

# 检查transformers版本
assert transformers.__version__ >= MIN_TRANSFORMERS_VERSION, f'请将transformers升级到{MIN_TRANSFORMERS_VERSION}或更高版本。'

# 初始化
tokenizer = AutoTokenizer.from_pretrained("Waterhorse/chessgpt-chat-v1")
model = AutoModelForCausalLM.from_pretrained("Waterhorse/chessgpt-chat-v1", torch_dtype=torch.float16)
model = model.to('cuda:0')

# 推理
# 两人对话
prompt = "A friendly, helpful chat between some humans.<|endoftext|>Human 0: 1.e4 c5, what is the name of this opening?<|endoftext|>Human 1:"
# 多人对话
#prompt = "A friendly, helpful chat between some humans.<|endoftext|>Human 0: 1.e4 c5, what is the name of this opening?<|endoftext|>Human 1: Sicilian defense.<|endoftext|>Human 2:"

inputs = tokenizer(prompt, return_tensors='pt').to(model.device)
input_length = inputs.input_ids.shape[1]
outputs = model.generate(
    **inputs, max_new_tokens=128, do_sample=True, temperature=0.7, top_p=0.7, top_k=50, return_dict_in_generate=True,
)
token = outputs.sequences[0, input_length:]
output_str = tokenizer.decode(token)
print(output_str)

📚 详细文档

使用范围

以下是排除的使用场景说明。

直接使用

国际象棋GPT聊天版v1主要用于大语言模型的研究，特别是那些关于策略学习和语言建模的研究。

非适用场景

国际象棋GPT聊天版v1是基于国际象棋相关数据训练的语言模型，对于国际象棋领域之外的其他用例可能表现不佳。

偏差、风险和局限性

与任何语言模型一样，国际象棋GPT聊天版v1存在一些固有的局限性，需要谨慎考虑。具体来说，它偶尔可能会生成不相关或不正确的回复，尤其是在处理复杂或模糊的查询时。此外，由于其训练基于在线数据，该模型可能会无意中反映和延续常见的网络刻板印象和偏差。

评估

请参考我们的论文和代码获取基准测试结果。

引用信息

@article{feng2023chessgpt,
  title={ChessGPT: Bridging Policy Learning and Language Modeling},
  author={Feng, Xidong and Luo, Yicheng and Wang, Ziyan and Tang, Hongrui and Yang, Mengyue and Shao, Kun and Mguni, David and Du, Yali and Wang, Jun},
  journal={arXiv preprint arXiv:2306.09200},
  year={2023}
}