Tarot_Question_Detector开源模型 - 精准检测文本是否为塔罗占卜问题

首页

Tarot Question Detector

由 AlexTANG-JX 开发

基于 DistilBERT 的文本分类模型，用于检测输入文本是否为符合塔罗占卜的问题。

文本分类

Safetensors

英语#塔罗问题识别 #轻量级BERT #英文文本分类

下载量 33

发布时间 : 3/13/2025

模型简介

该模型基于 DistilBERT 架构，专门用于判断输入文本是否符合塔罗占卜问题的特征。适用于占卜应用中的问题筛选场景。

模型特点

轻量级模型

基于 DistilBERT 架构，比标准 BERT 模型更小更快，同时保持较高准确率。

专门优化

针对塔罗占卜类问题的文本特征进行了专门训练和优化。

简单易用

提供直接推理脚本和 API 部署方案，便于集成到各类应用中。

模型能力

文本分类

问题检测

占卜问题识别

使用案例

占卜应用

占卜问题筛选

在塔罗牌占卜应用中自动筛选出有效的问题文本

准确识别符合占卜要求的问题

用户输入验证

验证用户输入是否符合占卜问题的格式要求

提高占卜系统的输入质量

🚀 DistilBERT 占卜问题检测模型

本项目提供了一个基于 DistilBERT 的占卜问题检测模型，可用于判断输入文本是否为符合塔罗占卜的问题，为塔罗占卜相关应用提供了有力的文本分类支持。

🚀 快速开始

1️⃣ 安装依赖

请确保你的环境已安装 Python 3.8+，然后运行以下命令安装所需的依赖库：

pip install torch transformers fastapi uvicorn safetensors

2️⃣ 直接运行推理

如果你想直接在本地测试模型，可以运行 inference.py：

python inference.py

基础用法

import torch
from transformers import DistilBertTokenizer, DistilBertForSequenceClassification

# 1. 加载模型
model_path = "./distilbert-question-detector"
tokenizer = DistilBertTokenizer.from_pretrained(model_path)
model = DistilBertForSequenceClassification.from_pretrained(model_path)
model.eval()

# 2. 进行推理
text = "Is this a question?"
inputs = tokenizer(text, return_tensors="pt", padding=True, truncation=True, max_length=128)

with torch.no_grad():
    outputs = model(**inputs)
    logits = outputs.logits
    probabilities = torch.nn.functional.softmax(logits, dim=-1)

predicted_class = torch.argmax(probabilities, dim=-1).item()

print(f"Probabilities: {probabilities}")
print(f"Predicted class: {predicted_class}")  # 1 代表是疑问句，0 代表不是

3️⃣ 运行 API

你也可以使用 FastAPI 部署一个 HTTP 接口，允许其他应用通过 HTTP 请求访问模型。

uvicorn app:app --host 0.0.0.0 --port 8000

高级用法

from fastapi import FastAPI
import torch
from transformers import DistilBertTokenizer, DistilBertForSequenceClassification

app = FastAPI()

# 加载模型
model_path = "./distilbert-question-detector/checkpoint-5150"
tokenizer = DistilBertTokenizer.from_pretrained(model_path)
model = DistilBertForSequenceClassification.from_pretrained(model_path)
model.eval()

@app.post("/predict/")
async def predict(text: str):
    inputs = tokenizer(text, return_tensors="pt", padding=True, truncation=True, max_length=128)

    with torch.no_grad():
        outputs = model(**inputs)
        logits = outputs.logits
        probabilities = torch.nn.functional.softmax(logits, dim=-1)

    predicted_class = torch.argmax(probabilities, dim=-1).item()
    return {"text": text, "probabilities": probabilities.tolist(), "predicted_class": predicted_class}

API 运行后，可通过以下方式测试：

curl -X 'POST' \
  'http://127.0.0.1:8000/predict/' \
  -H 'Content-Type: application/json' \
  -d '{"text": "Is this a valid question?"}'

📂 目录结构

属性	详情
model.safetensors	训练好的模型权重文件
config.json	模型架构的配置文件
tokenizer.json	分词器的配置文件
special_tokens_map.json	特殊标记的配置文件
vocab.txt	分词器的词汇文件

📌 结果说明

predicted_class: 0 代表输入文本是符合条件
predicted_class: 1 代表输入文本不符合条件

示例结果

{
    "text": "Is this a valid question?",
    "probabilities": [[0.9266, 0.0734]],
    "predicted_class": 0
}

📄 许可证

本项目采用 AFL-3.0 许可证。

精选推荐AI模型

Llama 3 Typhoon V1.5x 8b Instruct

专为泰语设计的80亿参数指令模型，性能媲美GPT-3.5-turbo，优化了应用场景、检索增强生成、受限生成和推理任务

Cadet-Tiny是一个基于SODA数据集训练的超小型对话模型，专为边缘设备推理设计，体积仅为Cosmo-3B模型的2%左右。

Roberta Base Chinese Extractive Qa

基于RoBERTa架构的中文抽取式问答模型，适用于从给定文本中提取答案的任务。

问答系统中文

uer

2,694

智启未来，您的人工智能解决方案智库

简体中文