库名称:transformers
许可证:mit
基础模型:dbmdz/bert-base-turkish-cased
标签:
- 训练生成
- 情感分析
- 土耳其语
评估指标:
- 准确率
- 精确率
- 召回率
- F1值
模型索引:
- 名称:turkish-sentiment
结果:[]
数据集:
- winvoker/turkish-sentiment-analysis-dataset
语言:
- tr
土耳其语情感分析模型
此模型是基于dbmdz/bert-base-turkish-cased在winvoker/turkish-sentiment-analysis-dataset数据集上微调的版本。
在评估集上达到以下结果:
- 损失:0.0880
- 准确率:0.9688
- F1宏平均:0.9454
- F1加权平均:0.9685
- 精确率:0.9683
- 召回率:0.9688
模型描述
基于BERT架构(dbmdz土耳其语BERT)的模型,在大型土耳其语情感分析数据集上微调。该模型将土耳其语文本分类为三种情感类别:负面(Negative)、中性(Notr)和正面(Positive)。
- 模型类型:BertForSequenceClassification
- 基础模型:dbmdz/bert-base-turkish-cased
- 支持语言:土耳其语
用途与限制
- 适用于土耳其语文本情感分析分类任务
- 适用于社交媒体数据、产品评论或通用土耳其语情感检测
使用示例
from transformers import pipeline
pipe = pipeline("text-classification", model="kaixkhazaki/turkish-sentiment")
pipe("Kargo geç geldi ve ürün beklentimi pek karşılamadı.")
>> [{'label': 'Negative', 'score': 0.984860897064209}]
pipe("Yemek lezzetliydi ancak servis yavaş ve çalışanlar ilgisizdi, pek anlayamadım nasıl hissettiğimi.")
>> [{'label': 'Notr', 'score': 0.9881975054740906}]
pipe("Gerçekten müthiş bir deneyimdi, keşke hep burda kalabilsem.")
>> [{'label': 'Positive', 'score': 0.9942901134490967}]
训练与评估数据
在包含440,679个训练样本和48,965个验证样本的组合数据集上微调。
训练过程
使用单GPU在完整数据集上训练约25分钟(1600步)。
训练超参数
训练期间使用的超参数:
- 学习率:3e-05
- 训练批大小:64
- 评估批大小:128
- 随机种子:42
- 优化器:使用adamw_torch,参数为betas=(0.9,0.999),epsilon=1e-08
- 学习率调度器类型:cosine
- 学习率预热步数:400
- 总训练步数:1600
训练结果
训练损失 |
周期 |
步数 |
验证损失 |
准确率 |
F1宏平均 |
F1加权平均 |
精确率 |
召回率 |
0.3538 |
0.0581 |
400 |
0.1162 |
0.9582 |
0.9243 |
0.9568 |
0.9572 |
0.9582 |
0.1131 |
0.1162 |
800 |
0.1034 |
0.9639 |
0.9369 |
0.9635 |
0.9633 |
0.9639 |
0.1026 |
0.1743 |
1200 |
0.0940 |
0.9649 |
0.9411 |
0.9652 |
0.9657 |
0.9649 |
0.0936 |
0.2324 |
1600 |
0.0880 |
0.9688 |
0.9454 |
0.9685 |
0.9683 |
0.9688 |
框架版本
- Transformers 4.48.0.dev0
- Pytorch 2.4.1+cu121
- Datasets 3.1.0
- Tokenizers 0.21.0
引用
@misc{turkish-sentiment,
title={Turkish Sentiment Analysis using Turkish BERT},
author={Fatih Demrici},
year={2025},
howpublished={\url{https://huggingface.co/kaixkhazaki/turkish-sentiment}},
}