P

Phi 3 Mini 4k Instruct Onnx Web

由 microsoft 开发
适用于浏览器内推理的Phi-3 Mini-4K-Instruct ONNX模型,通过ONNX Runtime Web加速浏览器中的推理。
下载量 243
发布时间 : 5/17/2024
模型介绍
内容详情
替代品

模型简介

这是一个轻量级、最先进的开源模型,拥有38亿参数,专注于高质量和推理密集的特性,适用于常识、语言理解、数学、代码、长上下文和逻辑推理等任务。

模型特点

浏览器内推理
完全在浏览器中运行,无需服务器支持,通过ONNX Runtime Web加速。
轻量级高性能
38亿参数的轻量级模型,在参数少于130亿的模型中展现了强大且最先进的性能。
WebGPU加速
推荐使用WebGPU后端高效运行,在NVIDIA GeForce RTX 4090上可达约42个令牌/秒。
优化存储
模型为fp16,权重采用int4块量化,确保模型和外部数据文件保持在2GB以下,便于在Chromium中缓存。

模型能力

文本生成
常识推理
语言理解
数学计算
代码生成
逻辑推理

使用案例

对话系统
智能聊天机器人
构建完全在浏览器中运行的对话式AI应用。
低延迟的交互体验
教育
学习助手
帮助学生解答数学、编程等问题。
提供即时、准确的解答