granite-question-classifier开源问题分类器 - 轻松区分通用与定向问题

首页

Granite Question Classifier

由 cnmoro 开发

基于 IBM Granite 嵌入模型微调的问题分类器，用于区分通用问题和定向问题

文本分类

Transformers

支持多种语言开源协议:MIT #问题分类 #RAG优化 #多语言支持

下载量 22

发布时间 : 1/31/2025

模型简介

该模型是对 ibm-granite/granite-embedding-30m-english 进行微调的版本，专门用于分类问题类型，区分通用问题（如请求摘要）和定向问题（如特定细节查询），以优化 RAG 管道中的操作。

模型特点

高准确率分类

在问题分类任务上达到94%的训练准确率

多语言支持

支持英语和葡萄牙语的问题分类

RAG 管道优化

通过区分问题类型优化检索增强生成流程

轻量级模型

基于高效的小型嵌入模型构建

模型能力

问题分类

文本分类

多语言处理

RAG 管道集成

使用案例

信息检索系统

RAG 管道优化

根据问题类型调整检索策略，通用问题采用摘要生成，定向问题采用精确检索

提高检索效率和结果相关性

问答系统

智能客服

识别用户问题是通用咨询还是具体问题，分配合适的回答策略

提升客服效率和用户满意度

🚀 花岗岩问题分类器

这是一个微调版的模型，旨在将问题分类为“定向”或“通用”，可优化RAG管道的操作，训练准确率达94%。

🚀 快速开始

这是ibm-granite/granite-embedding-30m-english的微调版本。其目标是将问题分类为“定向”或“通用”。如果一个问题不是定向的，我们会改变在RAG管道上执行的操作（例如，如果是通用问题，语义搜索可能不会直接起作用，如请求摘要）。（类别0是通用；类别1是定向）。训练期间达到的准确率为94%。

该模型旨在作为之前模型的升级版：点击查看

💻 使用示例

基础用法

import torch
from transformers import AutoTokenizer, AutoModelForSequenceClassification

model_id = "cnmoro/granite-question-classifier"
model = AutoModelForSequenceClassification.from_pretrained(model_id)
tokenizer = AutoTokenizer.from_pretrained(model_id)
model.eval()

def predict_question_category(question):  
    inputs = tokenizer.encode_plus(
        question,
        add_special_tokens=True,
        max_length=512,
        return_tensors="pt",
        truncation=True
    )
    
    input_ids = inputs["input_ids"]
    attention_mask = inputs["attention_mask"]
    
    with torch.no_grad():
        outputs = model(input_ids, attention_mask=attention_mask)
        logits = outputs.logits.squeeze(-1)
        print(logits)
        prediction = (logits > 0).float().item()
    
    # Map prediction to category
    return "directed" if prediction == 1.0 else "generic"

predict_question_category("Qual o resumo do texto?") # generic
predict_question_category("Qual foi a crítica que o autor recebeu do jornal, em relação a sua opinião?") # directed

📄 许可证

本项目采用MIT许可证。

📋 模型信息

属性	详情
模型类型	文本分类
训练数据	cnmoro/QuestionClassification-v2
基础模型	ibm-granite/granite-embedding-30m-english
库名称	transformers
支持语言	英语、葡萄牙语
标签	分类、问题、定向、通用