font-identifier开源字体识别模型 - 免费部署精准识别48种标准字体

首页

Font Identifier

由 gaborcselle 开发

基于ResNet18微调的字体识别模型，可识别48种标准字体，测试准确率达96.33%

图像分类

Transformers

英语开源协议:MIT #字体识别 #高准确率 #图像分类

下载量 1,292

发布时间 : 11/8/2023

模型简介

该模型用于识别图像中使用的字体类型，是基于Microsoft ResNet-18架构在字体样本数据集上微调得到的视觉分类器

模型特点

高准确率

在测试集上达到96.33%的识别准确率

快速训练

基于ResNet18轻量级架构，可在1天内完成训练

多字体支持

可识别48种常见标准字体

模型能力

字体识别

图像分类

视觉特征提取

使用案例

设计辅助

字体匹配

识别设计稿中使用的字体类型

准确识别48种标准字体中的任意一种

文档处理

文档分析

自动识别扫描文档或截图中的字体

🚀 字体识别器

本模型是基于 microsoft/resnet-18 在 imagefolder 数据集上进行微调的版本。结果显示：损失率为 0.1172；准确率为 0.9633。

你可以使用任何字体的截图进行测试，也可以使用本仓库 'samples' 子文件夹中的示例。

🚀 快速开始

本模型是 microsoft/resnet-18 在 imagefolder 数据集上的微调版本，结果为损失率 0.1172，准确率 0.9633。你可以用任意字体截图或本仓库 'samples' 子文件夹中的示例进行测试。

✨ 主要特性

字体识别：能够识别图像中使用的字体，是基于 ResNet18 的视觉分类器。
多平台记录：项目构建过程以分钟为单位记录，可在 Twitter/X、Pebble.social 和 Threads.net 查看。

📚 详细文档

模型描述

该模型用于识别图像中使用的字体，是基于 ResNet18 的视觉分类器。项目在一天内构建完成，构建过程的逐分钟记录可在 Twitter/X、Pebble.social 和 Threads.net 查看。构建此模型的代码位于此 GitHub 仓库中。

预期用途和限制

可从训练数据中识别 48 种标准字体中的任何一种。

训练和评估数据

在 gaborcselle/font-examples 数据集上进行训练和评估（80/20 分割）。

训练过程

训练超参数

训练期间使用了以下超参数：

学习率：5e - 05
训练批次大小：16
评估批次大小：16
随机种子：42
梯度累积步数：4
总训练批次大小：64
优化器：Adam（β=(0.9, 0.999)，ε = 1e - 08）
学习率调度器类型：线性
学习率调度器热身比例：0.1
训练轮数：50

训练结果

训练损失	轮数	步数	验证损失	准确率
4.0243	0.98	30	3.9884	0.0204
0.8309	10.99	338	0.5536	0.8551
0.3917	20.0	615	0.2353	0.9388
0.2298	30.99	953	0.1326	0.9633
0.1804	40.0	1230	0.1421	0.9571
0.1987	46.99	1445	0.1250	0.9673
0.1728	48.0	1476	0.1293	0.9633
0.1337	48.78	1500	0.1172	0.9633