边缘计算优化

# 边缘计算优化

Devstral Small 2505 GGUF

Devstral-Small-2505的量化版本，提供多种精度选择以适应不同硬件需求

大型语言模型支持多种语言

Japanese Reranker Tiny V2

这是一个非常小巧且快速的日语重排序模型，适用于提升RAG系统的精度，在CPU或边缘设备上也能高效运行。

文本嵌入日语

GLM Z1 9B 0414 GGUF

GLM-Z1-9B-0414 是一个支持中英双语的文本生成模型，采用 GGUF 格式，适用于多种量化级别，从 BF16 到超低位量化（1-2 比特）。

大型语言模型支持多种语言

Granite 3.3 8b Instruct GGUF

采用IQ-DynamicGate技术的超低位量化(1-2比特)语言模型，适用于内存受限环境

大型语言模型

Falcon E 3B Instruct

Falcon-E-3B-Instruct 是一个基于1.58比特架构的高效语言模型，专为边缘设备优化，具有出色的推理能力和低内存占用。

大型语言模型

Falcon E 1B Instruct

Falcon-E-1B-Instruct 是一个基于1.58比特架构的高效语言模型，专为边缘设备优化，具有低内存占用和高性能的特点。

大型语言模型

Falcon E 1B Base

Falcon-E-1B-Base 是由 TII 开发的一个高效 1.58 位语言模型，采用纯 Transformer 架构，专为边缘设备优化设计。

大型语言模型

Meta Llama 3 8B Instruct GGUF

基于Llama-3-8B-Instruct的IQ-DynamicGate超低位量化(1-2比特)模型，采用精度自适应量化技术，在保持极致内存效率的同时提升推理精度。

大型语言模型英语

Internvl2 5 1B GGUF BPU

InternVL2_5 - 1B 是一个基于图像文本到文本转换的多模态大模型，适用于视觉语言任务。

图像生成文本其他

Qwen2 VL 72B Instruct GGUF

Qwen2-VL-72B-Instruct的GGUF量化版本，支持多模态图像文本到文本转换，可通过LlamaEdge运行。

图像生成文本

Transformers 英语

Glm Edge V 5b Gguf

Glm-Edge-V-5B-GGUF是一个支持中英文的多语言图文生成文本模型，基于GLM架构开发。

大型语言模型支持多种语言

FLUX.1 Canny Dev GGUF

FLUX.1-Canny-dev 是一个基于文本生成图像的模型，专注于图像生成任务。

文本生成图像英语

GLM-Edge-V-2B是一个基于Pytorch框架的图像文本到文本模型，支持中文处理。

图像生成文本

基于TinyLlama-1.1B-Chat-v1.0的混合模型，提供轻量级LLM解决方案

大型语言模型

MIT Ast Finetuned Speech Commands V2 Ov

这是一个基于MIT/ast-finetuned-speech-commands-v2转换的OpenVINO优化版本，用于加速语音指令识别任务的推理运算。

Transformers 英语

精选推荐AI模型

Llama 3 Typhoon V1.5x 8b Instruct

专为泰语设计的80亿参数指令模型，性能媲美GPT-3.5-turbo，优化了应用场景、检索增强生成、受限生成和推理任务

大型语言模型

Transformers 支持多种语言

Cadet-Tiny是一个基于SODA数据集训练的超小型对话模型，专为边缘设备推理设计，体积仅为Cosmo-3B模型的2%左右。

Transformers 英语

Roberta Base Chinese Extractive Qa

基于RoBERTa架构的中文抽取式问答模型，适用于从给定文本中提取答案的任务。

问答系统中文

AIbase

智启未来，您的人工智能解决方案智库

简体中文

© 2025AIbase 备案号：闽ICP备08105208号-24