该模型是基于ModernBERT-large微调的LLM路由分类器,用于区分复杂查询(使用大语言模型)和简单查询(使用小语言模型)。
下载量 24
发布时间 : 1/5/2025
模型简介
基于ModernBERT-large微调的文本分类模型,专门用于LLM路由决策,将查询分类为需要大语言模型处理或小语言模型处理。
模型特点
高效路由
能够准确区分复杂查询和简单查询,优化LLM资源使用
高准确率
在测试集上F1分数达到0.9933,表现优异
基于ModernBERT
基于先进的ModernBERT-large架构微调,继承了其强大的文本理解能力
模型能力
文本分类
查询复杂度评估
LLM路由决策
使用案例
LLM资源优化
智能路由系统
在多个LLM服务间分配查询请求,优化计算资源使用
减少大模型的不必要调用,降低成本
聊天系统
根据用户问题复杂度选择适当的回答模型
提升响应速度同时保持复杂问题的回答质量
精选推荐AI模型
Llama 3 Typhoon V1.5x 8b Instruct
专为泰语设计的80亿参数指令模型,性能媲美GPT-3.5-turbo,优化了应用场景、检索增强生成、受限生成和推理任务
大型语言模型
Transformers

支持多种语言
L
scb10x
3,269
16
Cadet Tiny
Openrail
Cadet-Tiny是一个基于SODA数据集训练的超小型对话模型,专为边缘设备推理设计,体积仅为Cosmo-3B模型的2%左右。
对话系统
Transformers

英语
C
ToddGoldfarb
2,691
6
Roberta Base Chinese Extractive Qa
基于RoBERTa架构的中文抽取式问答模型,适用于从给定文本中提取答案的任务。
问答系统
中文
R
uer
2,694
98
AIbase是一个专注于MCP服务的平台,为AI开发者提供高质量的模型上下文协议服务,助力AI应用开发。
简体中文