V

Vit Chess V4

由 Migga 开发
基于Vision Transformer架构的象棋相关视觉模型,在未知数据集上微调
下载量 29
发布时间 : 7/21/2022
模型介绍
内容详情
替代品

模型简介

该模型是基于Vision Transformer架构的视觉模型,专门针对象棋相关任务进行微调。从性能指标来看,可能用于象棋棋盘状态识别或棋子分类等任务。

模型特点

基于ViT架构
采用Vision Transformer架构,可能更适合处理棋盘图像等结构化视觉数据
象棋专用
专门针对象棋相关视觉任务进行微调,可能优化了棋盘和棋子识别能力
线性学习率调度
训练采用线性学习率调度策略,有助于稳定训练过程

模型能力

象棋棋盘图像处理
棋子识别
棋盘状态分析

使用案例

棋类游戏
棋盘状态识别
从图像中识别象棋棋盘和棋子位置
验证集准确率19.42%
自动记谱
根据连续图像自动记录象棋走法