轻量级模型

# 轻量级模型

Devstral Small 2507 MLX 8bit

Devstral-Small-2507是一个支持多语言文本生成的模型，针对苹果芯片进行了优化。

大型语言模型

Safetensors 支持多种语言

lmstudio-community

Devstral Small 2507 MLX 6bit

Devstral-Small-2507是由mistralai开发的一个小型文本生成模型，支持多种语言，并针对苹果芯片进行了优化。

大型语言模型

Safetensors 支持多种语言

lmstudio-community

Google Codegemma 2b GGUF

CodeGemma 2B的GGUF量化版本，提供多种量化选项以优化性能

大型语言模型

featherless-ai-quants

Gemma 3n E2B It Unsloth Bnb 4bit

Gemma 3n-E2B-it 是 Google 推出的轻量级开源多模态模型，基于与 Gemini 相同技术构建，专为低资源设备优化。

图像生成文本

Transformers 英语

Gemma 3 1b It Medical O1 Reasoning Finetune 16bit

基于Gemma-3 1B模型微调的医学推理专用模型，支持逐步推理的医学问答

大型语言模型

Transformers 英语

Menlo Jan Nano GGUF

基于llama.cpp对Menlo/Jan - nano模型进行量化处理，提供多种量化类型的模型文件，以满足不同硬件和性能需求。

大型语言模型

Devanagari PP OCRv3 Mobile Rec

PaddleOCR团队开发的PP-OCRv3_rec系列中的天城文专用文本行识别模型，支持天城文识别，平均准确率96.44%。

文字识别支持多种语言

PP LCNet X1 0 Table Cls

PP-LCNet_x1_0_table_cls是一个高效的表格分类模型，用于对输入的表格图像进行分类，支持有线表格和无线表格的分类。

图像分类支持多种语言

Korean PP OCRv3 Mobile Rec

超轻量级韩语文本行识别模型，支持韩语和数字字符识别，平均准确率60.21%。

文字识别支持多种语言

Latin PP OCRv3 Mobile Rec

PaddleOCR团队开发的超轻量级拉丁语文本行识别模型，支持拉丁语和数字字符识别。

文字识别支持多种语言

Arabic PP OCRv3 Mobile Rec

PaddleOCR团队开发的超轻量级阿拉伯字母识别模型，支持阿拉伯字母和数字字符识别。

文字识别支持多种语言

PP LCNet X1 0 Doc Ori

文档图像方向分类模块，用于区分文档图像的方向并通过后处理进行校正，提高OCR处理的准确性。

图像分类支持多种语言

Final Complete Malicious Url Model GGUF

这是一个用于恶意URL检测的量化模型，基于BERT架构，能够有效识别恶意URL和钓鱼攻击。

Transformers 英语

Deepseek R1 0528 GGUF

DeepSeek-R1 是一个专注于数学基础与模型推理能力的大语言模型。

大型语言模型

Transformers 英语

基于Llama架构的5亿参数文本生成模型，专为创作故事而设计。

Brtgpt 124m Base

BrtGPT-124M-Base是一个基于大量英文语料预训练的基础模型，可免费使用，解决了开源模型使用繁琐和对处理能力要求高的问题。

大型语言模型

Devstral Small 2505 4bit DWQ

这是一个基于MLX格式的4位量化语言模型，适用于文本生成任务。

大型语言模型支持多种语言

Devstral Small 2505 Bf16

Devstral-Small-2505-bf16 是一个基于 MistralAI 的 Devstral-Small-2505 模型转换而来的 MLX 格式模型，支持多种语言处理任务。

大型语言模型支持多种语言

Ultravox V0 5 Llama 3 2 1b GGUF

Ultravox v0.5是基于Llama-3 2.1B架构优化的音频文本转文本模型，专注于高效处理语音转写任务。

Fastvlm 0.5B Stage3

FastVLM-0.5B-Stage3 是一个高效的多模态语言模型，具备视觉理解和语言处理能力，能够处理长视频并生成结构化输出。

图像生成文本

Transformers 英语

Fastvlm 0.5B Stage2

FastVLM-0.5B-Stage2是一个高效的多模态语言模型，能够理解视觉内容并处理文本任务。

多模态融合

Transformers 英语

Devstral Small 2505 MLX 6bit

由mistralai开发的轻量级语言模型，经过MLX框架6位量化优化，专为Apple Silicon设计。

大型语言模型支持多种语言

lmstudio-community

Dragonkue KoEn E5 Tiny

这是一个从intfloat/multilingual-e5-small微调而来的sentence-transformers模型，训练数据包含韩语查询-段落对，以提高韩语检索任务的性能。

文本嵌入支持多种语言

MiniCOIL是一种稀疏的上下文化逐词嵌入模型，专为高效语义相似度计算设计

文本嵌入英语

Japanese Reranker Tiny V2

这是一个非常小巧且快速的日语重排序模型，适用于提升RAG系统的精度，在CPU或边缘设备上也能高效运行。

文本嵌入日语

Japanese Reranker Xsmall V2

这是一个非常小巧且快速的日语重排序模型，适用于提升RAG系统的精度。

文本嵌入日语

All MiniLM L2 V2

该模型是从all-MiniLM-L12-v2蒸馏而来，推理速度提升近2倍，同时在CPU和GPU上保持较高的准确度。

文本嵌入支持多种语言

Qwen3 0.6B TLDR Lora

Qwen3-0.6B 是一个基于 Transformer 架构的开源语言模型，参数规模为 6 亿，适用于文本摘要等自然语言处理任务。

Phi 4 Mini Reasoning GGUF

Phi-4-mini-reasoning是一个基于合成数据的轻量级开放模型，专注于高质量、密集推理数据，并进一步微调以增强数学推理能力。

大型语言模型支持多种语言

Helium 1 2b Q8 0 GGUF

这是一个基于kyutai/helium-1-2b转换的GGUF格式模型，支持多种欧洲语言。

大型语言模型支持多种语言

Phi 4 Mini Reasoning

Phi-4-mini-reasoning是一个轻量级的开源模型，专注于高质量、密集推理的数据，并进一步微调以获得更高级的数学推理能力。

大型语言模型

Transformers 支持多种语言

Qwen3 1.7B ONNX

Qwen3-1.7B 是阿里云推出的1.7B参数规模的开源大语言模型，基于Transformer架构，支持多种自然语言处理任务。

大型语言模型

Segformer B0 Finetuned Morphpadver1 Hgo Coord V1

基于NVIDIA MIT-B1架构的SegFormer图像分割模型，在特定数据集上微调，擅长高精度图像分割任务

Deepthink 1.5B Open PRM Q8 0 GGUF

Deepthink-1.5B-Open-PRM是一个1.5B参数的开源语言模型，已转换为GGUF格式以便在llama.cpp中使用。

大型语言模型英语

Llamaestra 3.2 1B Translation GGUF

一个专注于英语和意大利语翻译的1B参数语言模型，提供多种量化版本的GGUF格式文件。

机器翻译支持多种语言

Llama OuteTTS 1.0 1B 3bit

这是一个基于MLX格式的3位量化文本转语音模型，支持多种语言。

语音合成支持多种语言

DeBERTa-v3-small是微软发布的轻量级DeBERTa模型变体，适用于文本分类任务。

Safetensors 英语

T5 Small Title Ft

T5 Small 是 Google 发布的 T5（Text-to-Text Transfer Transformer）模型的小型版本，适用于多种自然语言处理任务。

Transformers 英语

Faster Distil Whisper Large V3.5

Distil-Whisper是Whisper模型的蒸馏版本，针对自动语音识别(ASR)任务进行了优化，提供更快的推理速度。

语音识别英语

Mtmme Merge Gemma 2 9B NuSLERP W0.7 0.3

基于SLERP方法融合的Gemma-2B变体模型，结合了两个不同权重的Gemma-2B模型版本

大型语言模型

精选推荐AI模型

Llama 3 Typhoon V1.5x 8b Instruct

专为泰语设计的80亿参数指令模型，性能媲美GPT-3.5-turbo，优化了应用场景、检索增强生成、受限生成和推理任务

大型语言模型

Transformers 支持多种语言

Cadet-Tiny是一个基于SODA数据集训练的超小型对话模型，专为边缘设备推理设计，体积仅为Cosmo-3B模型的2%左右。

Transformers 英语

Roberta Base Chinese Extractive Qa

基于RoBERTa架构的中文抽取式问答模型，适用于从给定文本中提取答案的任务。

问答系统中文

AIbase

智启未来，您的人工智能解决方案智库

简体中文

© 2025AIbase 备案号：闽ICP备08105208号-24