模型简介
这是一个轻量级、最先进的开源模型,拥有38亿参数,专注于高质量和推理密集的特性,适用于常识、语言理解、数学、代码、长上下文和逻辑推理等任务。
模型特点
浏览器内推理
完全在浏览器中运行,无需服务器支持,通过ONNX Runtime Web加速。
轻量级高性能
38亿参数的轻量级模型,在参数少于130亿的模型中展现了强大且最先进的性能。
WebGPU加速
推荐使用WebGPU后端高效运行,在NVIDIA GeForce RTX 4090上可达约42个令牌/秒。
优化存储
模型为fp16,权重采用int4块量化,确保模型和外部数据文件保持在2GB以下,便于在Chromium中缓存。
模型能力
文本生成
常识推理
语言理解
数学计算
代码生成
逻辑推理
使用案例
对话系统
智能聊天机器人
构建完全在浏览器中运行的对话式AI应用。
低延迟的交互体验
教育
学习助手
帮助学生解答数学、编程等问题。
提供即时、准确的解答
精选推荐AI模型
Llama 3 Typhoon V1.5x 8b Instruct
专为泰语设计的80亿参数指令模型,性能媲美GPT-3.5-turbo,优化了应用场景、检索增强生成、受限生成和推理任务
大型语言模型
Transformers

支持多种语言
L
scb10x
3,269
16
Cadet Tiny
Openrail
Cadet-Tiny是一个基于SODA数据集训练的超小型对话模型,专为边缘设备推理设计,体积仅为Cosmo-3B模型的2%左右。
对话系统
Transformers

英语
C
ToddGoldfarb
2,691
6
Roberta Base Chinese Extractive Qa
基于RoBERTa架构的中文抽取式问答模型,适用于从给定文本中提取答案的任务。
问答系统
中文
R
uer
2,694
98
AIbase是一个专注于MCP服务的平台,为AI开发者提供高质量的模型上下文协议服务,助力AI应用开发。
简体中文