轻量级模型
Deepseek R1 0528 GGUF
MIT
DeepSeek-R1 是一个专注于数学基础与模型推理能力的大语言模型。
大型语言模型
Transformers
英语
D
unsloth
143
79
Arshstory
MIT
基于Llama架构的5亿参数文本生成模型,专为创作故事而设计。
文本生成
Transformers
A
arshiaafshani
131
1
Devstral Small 2505 4bit DWQ
Apache-2.0
这是一个基于MLX格式的4位量化语言模型,适用于文本生成任务。
大型语言模型
支持多种语言
D
mlx-community
238
3
Devstral Small 2505 Bf16
Apache-2.0
Devstral-Small-2505-bf16 是一个基于 MistralAI 的 Devstral-Small-2505 模型转换而来的 MLX 格式模型,支持多种语言处理任务。
大型语言模型
支持多种语言
D
mlx-community
207
1
Ultravox V0 5 Llama 3 2 1b GGUF
MIT
Ultravox v0.5是基于Llama-3 2.1B架构优化的音频文本转文本模型,专注于高效处理语音转写任务。
语音识别
U
ggml-org
421
1
Devstral Small 2505 MLX 6bit
Apache-2.0
由mistralai开发的轻量级语言模型,经过MLX框架6位量化优化,专为Apple Silicon设计。
大型语言模型
支持多种语言
D
lmstudio-community
751
4
Dragonkue KoEn E5 Tiny
Apache-2.0
这是一个从intfloat/multilingual-e5-small微调而来的sentence-transformers模型,训练数据包含韩语查询-段落对,以提高韩语检索任务的性能。
文本嵌入
支持多种语言
D
exp-models
607
5
Minicoil V1
Apache-2.0
MiniCOIL是一种稀疏的上下文化逐词嵌入模型,专为高效语义相似度计算设计
文本嵌入
英语
M
Qdrant
564
7
Japanese Reranker Tiny V2
MIT
这是一个非常小巧且快速的日语重排序模型,适用于提升RAG系统的精度,在CPU或边缘设备上也能高效运行。
文本嵌入
日语
J
hotchpotch
339
3
Japanese Reranker Xsmall V2
MIT
这是一个非常小巧且快速的日语重排序模型,适用于提升RAG系统的精度。
文本嵌入
日语
J
hotchpotch
260
1
All MiniLM L2 V2
Apache-2.0
该模型是从all-MiniLM-L12-v2蒸馏而来,推理速度提升近2倍,同时在CPU和GPU上保持较高的准确度。
文本嵌入
支持多种语言
A
tabularisai
5,063
2
Qwen3 0.6B TLDR Lora
Apache-2.0
Qwen3-0.6B 是一个基于 Transformer 架构的开源语言模型,参数规模为 6 亿,适用于文本摘要等自然语言处理任务。
文本生成
Q
phh
56
0
Phi 4 Mini Reasoning GGUF
MIT
Phi-4-mini-reasoning是一个基于合成数据的轻量级开放模型,专注于高质量、密集推理数据,并进一步微调以增强数学推理能力。
大型语言模型
支持多种语言
P
unsloth
21.71k
27
Helium 1 2b Q8 0 GGUF
这是一个基于kyutai/helium-1-2b转换的GGUF格式模型,支持多种欧洲语言。
大型语言模型
支持多种语言
H
NikolayKozloff
53
3
Phi 4 Mini Reasoning
MIT
Phi-4-mini-reasoning是一个轻量级的开源模型,专注于高质量、密集推理的数据,并进一步微调以获得更高级的数学推理能力。
大型语言模型
Transformers
支持多种语言
P
microsoft
18.93k
152
Qwen3 1.7B ONNX
Qwen3-1.7B 是阿里云推出的1.7B参数规模的开源大语言模型,基于Transformer架构,支持多种自然语言处理任务。
大型语言模型
Transformers
Q
onnx-community
189
1
Segformer B0 Finetuned Morphpadver1 Hgo Coord V1
其他
基于NVIDIA MIT-B1架构的SegFormer图像分割模型,在特定数据集上微调,擅长高精度图像分割任务
图像分割
Transformers
S
NICOPOI-9
29
0
Deepthink 1.5B Open PRM Q8 0 GGUF
Apache-2.0
Deepthink-1.5B-Open-PRM是一个1.5B参数的开源语言模型,已转换为GGUF格式以便在llama.cpp中使用。
大型语言模型
英语
D
prithivMLmods
46
2
Llamaestra 3.2 1B Translation GGUF
一个专注于英语和意大利语翻译的1B参数语言模型,提供多种量化版本的GGUF格式文件。
机器翻译
支持多种语言
L
tensorblock
5,028
1
Llama OuteTTS 1.0 1B 3bit
这是一个基于MLX格式的3位量化文本转语音模型,支持多种语言。
语音合成
支持多种语言
L
mlx-community
16
0
Ai Cop
DeBERTa-v3-small是微软发布的轻量级DeBERTa模型变体,适用于文本分类任务。
文本分类
Safetensors
英语
A
dejanseo
53
1
T5 Small Title Ft
Apache-2.0
T5 Small 是 Google 发布的 T5(Text-to-Text Transfer Transformer)模型的小型版本,适用于多种自然语言处理任务。
文本生成
Transformers
英语
T
swarup3204
25
0
Faster Distil Whisper Large V3.5
MIT
Distil-Whisper是Whisper模型的蒸馏版本,针对自动语音识别(ASR)任务进行了优化,提供更快的推理速度。
语音识别
英语
F
Purfview
565
2
Mtmme Merge Gemma 2 9B NuSLERP W0.7 0.3
基于SLERP方法融合的Gemma-2B变体模型,结合了两个不同权重的Gemma-2B模型版本
大型语言模型
Transformers
M
zelk12
16
2
Text To Cypher Gemma 3 4B Instruct 2025.04.0
Gemma 3.4B IT 是一个基于文本到文本生成的大语言模型,专门用于将自然语言转换为Cypher查询语言。
知识图谱
T
neo4j
596
2
Mizan Rerank V1
Apache-2.0
一款革命性的开源模型,能以卓越的效率和准确性对阿拉伯语长文本进行重排序。
文本嵌入
支持多种语言
M
ALJIACHI
167
1
DASS Small AudioSet 47.2
Bsd-3-clause
首个超越基于Transformer的音频分类器的状态空间模型,在AudioSet音频分类任务中实现最先进性能,同时显著减小模型规模。
音频分类
Transformers
D
saurabhati
47
1
Learn Hf Food Not Food Text Classifier Distilbert Base Uncased
Apache-2.0
基于DistilBERT的文本分类模型,用于区分食品与非食品文本
文本分类
Transformers
L
HimanshuGoyal2004
70
1
Allura Org Gemma 3 Glitter 4B GGUF
基于allura-org/Gemma-3-Glitter-4B转换的GGUF格式模型文件,使用imatrix量化优化性能
大型语言模型
英语
A
ArtusDev
69
1
Codesearch ModernBERT Snake
Apache-2.0
专为代码搜索设计的句子转换器模型,基于ModernBERT架构,支持8192标记长序列处理
文本嵌入
英语
C
Shuu12121
36
2
Snac 24khz ONNX
MIT
SNAC 24kHz 是一个用于特征提取的模型,适用于音频信号处理任务。
音频分类
S
onnx-community
46
1
Tinyllava Video Qwen2.5 3B Group 16 512
Apache-2.0
TinyLLaVA-Video是基于Qwen2.5-3B和siglip-so400m-patch14-384构建的视频理解模型,采用分组重采样器处理视频帧
视频生成文本
T
Zhang199
76
0
Whisper Custom Small
Apache-2.0
基于 OpenAI Whisper 架构的小型语音识别模型,专注于英语语音转文本任务。
语音识别
英语
W
gyrroa
15
1
Gemma 2 2b Jpn It Translate I1 GGUF
基于webbigdata/gemma-2-2b-jpn-it-translate的量化版本,专注于日语和英语之间的翻译任务
机器翻译
支持多种语言
G
mradermacher
182
1
Smoldocling 256M Preview Mlx Fp16
Apache-2.0
该模型是从 ds4sd/SmolDocling-256M-preview 转换为 MLX 格式的视觉语言模型,支持图像文本到文本任务。
图像生成文本
Transformers
英语
S
ahishamm
24
1
Distil Large V3.5 Ct2
MIT
Distil-Whisper是Whisper模型的蒸馏版本,通过大规模伪标签技术实现高效语音识别
语音识别
英语
D
distil-whisper
264
3
Lightblue Reranker 0.5 Cont Gguf
这是一个文本排序模型,用于对文本进行重新排序和评分。
文本嵌入
L
RichardErkhov
1,986
0
Lightblue Reranker 0.5 Cont Filt Gguf
基于Qwen2.5-0.5B-Instruct微调的文本排序模型,适用于信息检索和相关性排序任务
大型语言模型
L
RichardErkhov
2,130
0
Jbaron34 Qwen2.5 0.5b Bebop Reranker Newer Small Gguf
基于Qwen2.5架构的0.5亿参数文本排序模型,适用于信息检索和文档排序任务
大型语言模型
J
RichardErkhov
2,117
0
Jbaron34 Qwen2.5 0.5b Bebop Reranker New Small Gguf
基于Qwen2.5架构的0.5B参数规模的文本排序模型,适用于重排序任务。
大型语言模型
J
RichardErkhov
2,454
0