标签:
- 训练生成
数据集:
- 发票
指标:
- 精确率
- 召回率
- F1值
- 准确率
模型索引:
- 名称: layoutlmv3-finetuned-invoice
结果:
- 任务:
名称: 令牌分类
类型: token-classification
数据集:
名称: 发票
类型: invoice
参数: invoice
指标:
- 名称: 精确率
类型: precision
值: 1.0
- 名称: 召回率
类型: recall
值: 1.0
- 名称: F1值
类型: f1
值: 1.0
- 名称: 准确率
类型: accuracy
值: 1.0
基于发票数据集微调的LayoutLM-v3模型
本模型是在发票数据集上对microsoft/layoutlmv3-base进行微调的版本。
我们使用微软的LayoutLMv3模型在发票数据集上进行训练,以预测开票方名称、开票方地址、开票方邮编、到期日期、消费税、发票日期、发票号码、小计和总计。使用时只需上传一张图片或使用下方示例图片,结果将在几秒内显示。
在评估集上达到如下结果:
- 损失: 0.0012
- 精确率: 1.0
- 召回率: 1.0
- F1值: 1.0
- 准确率: 1.0
模型描述
需要更多信息
预期用途与限制
需要更多信息
训练与评估数据
所有训练代码可从以下GitHub链接获取:
https://github.com/Theivaprakasham/layoutlmv3
该模型可在HuggingFace Spaces链接进行评估:
https://huggingface.co/spaces/Theivaprakasham/layoutlmv3_invoice
训练过程
训练超参数
训练过程中使用了以下超参数:
- 学习率: 1e-05
- 训练批次大小: 2
- 评估批次大小: 2
- 随机种子: 42
- 优化器: Adam,参数beta=(0.9,0.999),epsilon=1e-08
- 学习率调度器类型: 线性
- 训练步数: 2000
训练结果
训练损失 |
周期 |
步数 |
验证损失 |
精确率 |
召回率 |
F1值 |
准确率 |
无记录 |
2.0 |
100 |
0.0878 |
0.968 |
0.9817 |
0.9748 |
0.9966 |
无记录 |
4.0 |
200 |
0.0241 |
0.972 |
0.9858 |
0.9789 |
0.9971 |
无记录 |
6.0 |
300 |
0.0186 |
0.972 |
0.9858 |
0.9789 |
0.9971 |
无记录 |
8.0 |
400 |
0.0184 |
0.9854 |
0.9574 |
0.9712 |
0.9956 |
0.1308 |
10.0 |
500 |
0.0121 |
0.972 |
0.9858 |
0.9789 |
0.9971 |
0.1308 |
12.0 |
600 |
0.0076 |
0.9939 |
0.9878 |
0.9908 |
0.9987 |
0.1308 |
14.0 |
700 |
0.0047 |
1.0 |
0.9959 |
0.9980 |
0.9996 |
0.1308 |
16.0 |
800 |
0.0036 |
0.9960 |
0.9980 |
0.9970 |
0.9996 |
0.1308 |
18.0 |
900 |
0.0045 |
0.9960 |
0.9980 |
0.9970 |
0.9996 |
0.0069 |
20.0 |
1000 |
0.0043 |
0.9960 |
0.9980 |
0.9970 |
0.9996 |
0.0069 |
22.0 |
1100 |
0.0016 |
1.0 |
1.0 |
1.0 |
1.0 |
0.0069 |
24.0 |
1200 |
0.0015 |
1.0 |
1.0 |
1.0 |
1.0 |
0.0069 |
26.0 |
1300 |
0.0014 |
1.0 |
1.0 |
1.0 |
1.0 |
0.0069 |
28.0 |
1400 |
0.0013 |
1.0 |
1.0 |
1.0 |
1.0 |
0.0026 |
30.0 |
1500 |
0.0012 |
1.0 |
1.0 |
1.0 |
1.0 |
0.0026 |
32.0 |
1600 |
0.0012 |
1.0 |
1.0 |
1.0 |
1.0 |
0.0026 |
34.0 |
1700 |
0.0011 |
1.0 |
1.0 |
1.0 |
1.0 |
0.0026 |
36.0 |
1800 |
0.0011 |
1.0 |
1.0 |
1.0 |
1.0 |
0.0026 |
38.0 |
1900 |
0.0011 |
1.0 |
1.0 |
1.0 |
1.0 |
0.002 |
40.0 |
2000 |
0.0011 |
1.0 |
1.0 |
1.0 |
1.0 |
框架版本
- Transformers 4.20.0.dev0
- Pytorch 1.11.0+cu113
- Datasets 2.2.2
- Tokenizers 0.12.1