开源student_chat_toxicity_classifier_model - 检测学生对话有害内容利器

首页

Student Chat Toxicity Classifier Model

由 Sk1306 开发

基于RoBERTa微调的文本分类模型，专门用于检测学生对话中的有害内容

文本分类

Transformers

英语#学生聊天审核 #作弊行为检测 #道德交流促进

下载量 17

发布时间 : 1/17/2025

模型简介

该模型可识别学生聊天中的不当行为建议、不道德指导或有害交流，促进道德且积极的互动关系

模型特点

教育场景优化

针对学生聊天场景微调，特别擅长识别作弊建议等教育场景特有有害内容

道德交流促进

通过标记有害信息，帮助学生建立更健康的交流环境

实时检测能力

适合集成到聊天应用中实现实时内容审核

模型能力

文本毒性检测

教育场景有害内容识别

实时聊天内容审核

使用案例

教育科技

学生聊天审核

集成到教育平台的学生聊天功能中，自动标记不当言论

减少90%的有害信息传播（基于测试数据）

在线学习监督

监控在线学习平台的讨论区，防止作弊建议传播

🚀 学生聊天毒性分类器

该模型是 s-nlp/roberta_toxicity_classifier 的微调版本，旨在将学生对话中的文本消息分类为有毒或无毒。它专门用于检测和标记作弊建议、不道德建议或任何有毒的交流内容，同时鼓励学生之间进行符合道德规范且积极的互动。

🚀 在这个 Hugging Face 空间中实时试用该模型 🚀

📚 模型详情

属性	详情
语言	英语 (`en`)
基础模型	`s-nlp/roberta_toxicity_classifier`
任务	文本分类（二分类） - 类别 0：无毒 - 类别 1：有毒

✨ 主要特性

检测宣扬作弊或违规行为的消息。
标记学生聊天中有害或不道德的建议。
鼓励符合道德规范且有建设性的交流。

🔧 训练细节

数据集：该模型在一个自定义数据集上进行微调，该数据集包含标记为有毒（作弊建议、有害建议）或无毒（积极且有建设性的交流）的学生对话示例。
预处理：
- 使用 RobertaTokenizer 进行分词。
- 应用截断和填充以确保输入长度一致（max_length=128）。
框架：Hugging Face 的 transformers 库。
优化器：AdamW
损失函数：CrossEntropyLoss
训练轮数：3（根据收敛情况调整）

📋 预期用途

此模型适用于教育平台、聊天审核工具和学生交流应用程序。其目的是：

检测有毒消息，如作弊建议、有害建议或不道德的推荐。
为学生营造积极且相互尊重的聊天环境。

💻 使用示例

基础用法

from gradio_client import Client

client = Client("Sk1306/Student_Ethics_Chat_Classifier")
result = client.predict(
		text="you can copy in exam to pass!!",
		api_name="/predict"
)
print(result)

高级用法

import torch
from transformers import RobertaTokenizer, RobertaForSequenceClassification

# 加载模型和分词器
model_name = "Sk1306/student_chat_toxicity_classifier_model"
tokenizer = RobertaTokenizer.from_pretrained(model_name)
model = RobertaForSequenceClassification.from_pretrained(model_name)

# 毒性预测函数
def predict_toxicity(text):
    # 对输入文本进行分词
    inputs = tokenizer(text, return_tensors="pt", truncation=True, padding=True, max_length=128)

    # 将文本输入模型
    with torch.no_grad():
        outputs = model(**inputs)
    
    # 提取 logits 并应用 softmax 函数以获取概率
    logits = outputs.logits
    probabilities = torch.nn.functional.softmax(logits, dim=-1)

    # 获取预测类别（0 = 无毒，1 = 有毒）
    predicted_class = torch.argmax(probabilities, dim=-1).item()
    return "Non-Toxic" if predicted_class == 0 else "Toxic"

# 测试模型
message = "You can copy answers during the exam."
prediction = predict_toxicity(message)
print(f"Message: {message}\nPrediction: {prediction}")