🚀 联合国可持续发展目标文本分类机器学习模型
本机器学习模型可根据联合国17个可持续发展目标中的前15个对文本进行分类。该模型在较短段落(约100个单词)上进行训练,在处理类似长度的输入时表现最佳。数据来源于出色的 https://osdg.ai/ 社区!
相关背景信息
消除对妇女和女童的一切形式歧视不仅是一项基本人权,而且对于加速可持续发展至关重要。事实一再证明,赋予妇女和女童权力具有乘数效应,有助于全面推动经济增长和发展。自2000年以来,联合国开发计划署(UNDP)与联合国伙伴及全球社会各界共同努力,将性别平等置于工作的核心位置。自那时起,我们已取得显著进展。与15年前相比,现在更多女童能够接受教育,大多数地区在初等教育阶段已实现性别平等。目前,女性在农业以外的带薪劳动者中所占比例达到41%,而1990年这一比例为35%。
数据集
- jonas/osdg_sdg_data_processed
二氧化碳排放量
0.0653263174784986
🚀 快速开始
本模型可用于对文本进行分类,以匹配联合国可持续发展目标。以下为使用示例。
✨ 主要特性
- 能够根据联合国17个可持续发展目标中的前15个对文本进行分类。
- 在较短段落(约100个单词)上训练,对类似长度输入表现最佳。
📦 安装指南
文档未提及安装步骤,暂不提供。
💻 使用示例
基础用法
你可以使用cURL来访问这个模型:
$ curl -X POST -H "Authorization: Bearer YOUR_API_KEY" -H "Content-Type: application/json" -d '{"inputs": "I love AutoTrain"}' https://api-inference.huggingface.co/models/jonas/autotrain-osdg-sdg-classifier-900229515
高级用法
使用Python API:
from transformers import AutoModelForSequenceClassification, AutoTokenizer
model = AutoModelForSequenceClassification.from_pretrained("jonas/sdg_classifier_osdg", use_auth_token=True)
tokenizer = AutoTokenizer.from_pretrained("jonas/sdg_classifier_osdg", use_auth_token=True)
inputs = tokenizer("I love AutoTrain", return_tensors="pt")
outputs = model(**inputs)
📚 详细文档
关于模型
本模型是用于根据联合国可持续发展目标对文本进行分类的机器学习模型。需要注意的是,该模型在较短段落(约100个单词)上进行训练,在处理类似长度的输入时表现最佳。
改进版本
有该模型的改进版本(微调后的Roberta)可在此处获取:https://huggingface.co/jonas/roberta-base-finetuned-sdg
模型训练详情
- 问题类型:多类分类
- 模型ID:900229515
- 二氧化碳排放量(克):0.0653263174784986
验证指标
指标 |
数值 |
损失 |
0.3644874095916748 |
准确率 |
0.8972544579677328 |
宏F1值 |
0.8500873710954522 |
微F1值 |
0.8972544579677328 |
加权F1值 |
0.8937529692986061 |
宏精确率 |
0.8694369727467804 |
微精确率 |
0.8972544579677328 |
加权精确率 |
0.8946984684977016 |
宏召回率 |
0.8405065997404059 |
微召回率 |
0.8972544579677328 |
加权召回率 |
0.8972544579677328 |
🔧 技术细节
模型基于多类分类问题进行训练,使用特定的数据集进行学习,以实现对文本的分类功能。训练过程中记录了二氧化碳排放量,同时通过一系列验证指标来评估模型性能。
📄 许可证
文档未提及许可证信息,暂不提供。