Birds-Classifier-EfficientNetB2开源鸟类图像分类器 - 精准识别525种鸟类，准确率99%

首页

Birds Classifier EfficientNetB2

由 dennisjooo 开发

基于EfficientNet-B2微调的鸟类图像分类器，可识别525种鸟类，准确率高达99%

图像分类

Transformers

开源协议:Apache-2.0 #高精度鸟类识别 #EfficientNet微调 #多品种分类

下载量 4,320

发布时间 : 9/24/2023

模型简介

该模型用于识别鸟类品种，基于EfficientNet-B2架构在525种鸟类数据集上微调而成，具有极高的分类准确率。

模型特点

高准确率

在测试集上达到99.12%的准确率，远超随机猜测的0.19%

广泛覆盖

支持525种不同鸟类的识别

高效架构

基于EfficientNet-B2，平衡了准确率和计算效率

数据增强

训练时使用了随机旋转和水平翻转增强数据

模型能力

鸟类图像分类

多类别识别

高精度视觉识别

使用案例

生物研究

鸟类品种识别

帮助研究人员快速识别野外拍摄的鸟类品种

准确识别525种不同鸟类

教育应用

观鸟学习工具

为学生和观鸟爱好者提供实时鸟类识别功能

提升学习效率和兴趣

🚀 鸟类分类器EfficientNet - B2

本项目的鸟类分类器基于EfficientNet - B2模型，可利用图像分类技术准确识别鸟类物种，为鸟类识别提供了高效、准确的解决方案。

🚀 快速开始

本模型可用于图像分类任务。以下是使用该模型对鸟类图片进行分类的示例代码。

基础用法

# Importing the libraries needed
import torch
import urllib.request
from PIL import Image
from transformers import EfficientNetImageProcessor, EfficientNetForImageClassification

# Determining the file URL
url = 'some url'

# Opening the image using PIL
img = Image.open(urllib.request.urlretrieve(url)[0])

# Loading the model and preprocessor from HuggingFace
preprocessor = EfficientNetImageProcessor.from_pretrained("dennisjooo/Birds-Classifier-EfficientNetB2")
model = EfficientNetForImageClassification.from_pretrained("dennisjooo/Birds-Classifier-EfficientNetB2")

# Preprocessing the input
inputs = preprocessor(img, return_tensors="pt")

# Running the inference
with torch.no_grad():
    logits = model(**inputs).logits

# Getting the predicted label
predicted_label = logits.argmax(-1).item()
print(model.config.id2label[predicted_label])

高级用法

# Importing the libraries needed
import torch
import urllib.request
from PIL import Image
from transformers import pipeline

# Determining the file URL
url = 'some url'

# Opening the image using PIL
img = Image.open(urllib.request.urlretrieve(url)[0])

# Loading the model and preprocessor using Pipeline
pipe = pipeline("image-classification", model="dennisjooo/Birds-Classifier-EfficientNetB2")

# Running the inference
result = pipe(img)[0]

# Printing the result label
print(result['label'])

✨ 主要特性

高精度识别：在训练集、验证集和测试集上均表现出色，训练集准确率达0.999480，验证集准确率达0.985904，测试集准确率达0.991238。
基于优秀基础模型：该模型是在[google/efficientnet - b2](https://huggingface.co/google/efficientnet - b2)基础上微调而来，原模型在ImageNet - 1K上训练，具备一定的特征识别能力。

📚 详细文档

模型描述

你是否曾看着一只鸟，心想“要是我知道这是什么鸟就好了”？除非你是狂热的观鸟者（或者只是单纯热爱鸟类），否则很难区分某些鸟类物种。不过你很幸运，事实证明可以使用图像分类器来识别鸟类物种！

本模型是[google/efficientnet - b2](https://huggingface.co/google/efficientnet - b2)在Kaggle上的[gpiosenka/100 - bird - species](https://www.kaggle.com/datasets/gpiosenka/100 - bird - species)数据集上的微调版本。用于训练模型的数据集于2023年9月24日获取。

原始模型本身在ImageNet - 1K上进行训练，因此它可能仍然具有一些用于识别鸟类等生物的有用特征。

理论上，在该数据集上随机猜测的准确率为0.0019047619（本质上是1/525）。该模型在所有三个数据集上的表现都非常好，结果如下：

训练集：0.999480
验证集：0.985904
测试集：0.991238

预期用途

你可以使用原始模型进行图像分类。上述代码示例展示了模型的具体使用方式。

训练与评估

数据

数据集来自Kaggle上的[gpiosenka/100 - bird - species](https://www.kaggle.com/datasets/gpiosenka/100 - bird - species)。它包含525种鸟类，有84635张训练图像，验证集和测试集各有2625张图像。数据集中的每张图像都是224×224的RGB图像。

训练过程使用了作者提供的相同数据划分。更多详细信息，请参考[作者的Kaggle页面](https://www.kaggle.com/datasets/gpiosenka/100 - bird - species)。

训练过程

训练使用PyTorch在Kaggle的免费P100 GPU上进行。该过程还使用了Lightning和Torchmetrics库。

预处理

每张图像根据原作者的[配置](https://huggingface.co/google/efficientnet - b2/blob/main/preprocessor_config.json)进行预处理。

训练集还使用了以下数据增强方法：

以50%的概率随机旋转10度
以50%的概率随机水平翻转

训练超参数

以下是训练使用的超参数：

属性	详情
训练模式	fp32
损失函数	交叉熵
优化器	Adam（默认betas为(0.99, 0.999)）
学习率	1e - 3
学习率调度器	Reduce on plateau（监控验证损失，耐心值为2，衰减率为0.1）
批量大小	64
提前停止策略	监控验证准确率，耐心值为10