Qwen3 4B Llamafile
Apache-2.0
Qwen3-4B是Qwen系列最新一代的大语言模型,具有4B参数规模,支持128k上下文窗口和100多种语言,在推理、指令遵循和代理能力方面表现优异。
大型语言模型
Q
Mozilla
995
2
Qwen3 1.7B Q8 0 GGUF
Apache-2.0
Qwen3-1.7B-Q8_0-GGUF是基于Qwen/Qwen3-1.7B转换的GGUF格式模型,支持文本生成任务,具备多语言支持和高效的推理能力。
大型语言模型
Q
Triangle104
277
1
HMS Slerp 12B V2
这是一个通过SLERP方法融合的12B参数规模的多语言大语言模型,支持英文和日文处理。
大型语言模型
Transformers

支持多种语言
H
yamatazen
16
2
Jungzoona T3Q Qwen2.5 14b V1.0 E3 GGUF
Apache-2.0
本仓库包含JungZoona/T3Q-qwen2.5-14b-v1.0-e3的GGUF格式模型文件,由TensorBlock提供的机器进行量化,兼容llama.cpp。
大型语言模型
Transformers

支持多种语言
J
tensorblock
557
1
Minicpm S 1B Sft
Apache-2.0
MiniCPM-S-1B-sft 是一个基于激活稀疏化技术优化的1B参数规模语言模型,通过ProSparse方法实现高稀疏性推理加速,同时保持与原始模型相当的性能。
大型语言模型
Transformers

支持多种语言
M
openbmb
169
10
Qwen2.5 1.5B Instruct GGUF
Apache-2.0
Qwen2.5是Qwen大语言模型的最新系列,1.5B参数规模的指令调优模型,支持多语言和长文本生成。
大型语言模型
英语
Q
Mungert
556
4
Kyro N1.1 7B Pytorch
其他
Kyro-n1.1是Kyro-n1的增强版本,基于Qwen2.5-7B-Instruct构建,优化了推理能力、理解能力和响应精准度。
大型语言模型
Transformers

支持多种语言
K
open-neo
41
2
Llama 3.1 8B Instruct GGUF
Meta Llama 3.1系列是多语言大语言模型(LLMs)的集合,包括8B、70B和405B大小的预训练和指令调优生成模型。
大型语言模型
支持多种语言
L
unsloth
4,071
6
Elastic Qwen2.5 7B Instruct
Apache-2.0
弹性模型是由TheStage AI ANNA生成的模型系列,通过滑动控制条可自由调节模型规模、延迟与质量,为自托管场景提供最快最灵活的解决方案。
大型语言模型
支持多种语言
E
TheStageAI
30
2
HMS Slerp 12B
HMS-Slerp-12B 是一个采用SLERP球面线性插值法合并的多语言聊天模型,支持英语和日语。
大型语言模型
Transformers

支持多种语言
H
yamatazen
41
2
Elvenmaid 12B Stock
基于ElvenMaid-12B系列模型合并的ChatML格式语言模型,支持英文和日文
大型语言模型
Transformers

支持多种语言
E
yamatazen
35
2
Phi 4 Mini Instruct Float8dq
MIT
Phi-4-mini-instruct模型经torchao进行float8动态激活和权重量化,在H100上实现36%显存降低和15-20%速度提升,几乎不影响精度。
大型语言模型
Transformers

其他
P
pytorch
1,006
1
Elvenmaid 12B
ElvenMaid-12B 是一个基于 ChatML 格式的 12B 参数语言模型,通过 mergekit 工具合并多个预训练模型而成,支持英文和日文交互。
大型语言模型
Transformers

支持多种语言
E
yamatazen
38
2
Himeyuri Magnum 12B
Himeyuri-Magnum-12B 是一个基于 ChatML 格式的多语言预训练语言模型,通过 mergekit 工具合并多个 12B 参数规模的模型而成。
大型语言模型
Transformers

支持多种语言
H
yamatazen
22
2
Fibonacci 2 14B
MIT
基于Phi 4架构的大型语言模型,拥有140亿参数,针对自然语言处理和文本对话任务进行了优化。
大型语言模型
支持多种语言
F
fibonacciai
97
13
Trillion 7B Preview AWQ
Apache-2.0
Trillion-7B预览版是一款多语言大语言模型,支持英语、韩语、日语和中文,在计算效率和性能表现上优于同类7B规模模型。
大型语言模型
支持多种语言
T
trillionlabs
22
4
Trillion 7B Preview
Apache-2.0
Trillion-7B预览版是一款多语言大型语言模型,支持英语、韩语、日语和中文,在保持较低计算量的同时实现了与更高计算量模型竞争的性能。
大型语言模型
Transformers

支持多种语言
T
trillionlabs
6,864
82
Etherealaurora 12B V2
基于ChatML架构的对话模型,通过mergekit工具合并预训练语言模型生成
大型语言模型
Transformers

支持多种语言
E
yamatazen
859
16
Kyro N1.1 7B
其他
Kyro-n1.1是Kyro-n1的增强版本,基于Qwen2.5-7B-Instruct构建,优化了推理能力、理解力和响应精准度。
大型语言模型
Transformers

支持多种语言
K
open-neo
470
4
Bloomvn 8B Chat Reasoning
MIT
专为越南语推理优化的多语言微调模型,具备分步推理能力,采用结构化XML格式
大型语言模型
Transformers

支持多种语言
B
BlossomsAI
68
2
Aurora SCE 12B
基于SCE方法合并的多语言ChatML模型,支持英文和日文对话
大型语言模型
Transformers

支持多种语言
A
yamatazen
51
6
Fibonacci 1 EN 8b Chat.p1 5
MIT
Fibonacci-1-EN-8b-Chat.P1_5是基于LLaMA架构的大型语言模型,具有80.3亿参数,针对自然语言处理任务和文本对话进行了优化。
大型语言模型
支持多种语言
F
fibonacciai
132
11
Ozone Ai 0x Lite GGUF
Apache-2.0
基于ozone-ai/0x-lite模型的量化版本,支持中英文文本生成任务,采用llama.cpp进行imatrix量化,提供多种量化选项以适应不同硬件需求。
大型语言模型
支持多种语言
O
bartowski
220
2
Razorback 12B V0.2
其他
Razorback 12B v0.2 是一个结合了Pixtral 12B和UnslopNemo v3优势的多模态模型,具备视觉理解和语言处理能力。
图像生成文本
Transformers

支持多种语言
R
nintwentydo
17
3
Openbuddy Deepseek 10b V17.1 4k GGUF
其他
OpenBuddy/openbuddy-deepseek-10b-v17.1-4k的GGUF格式模型文件,支持多种语言,适用于文本生成任务。
大型语言模型
支持多种语言
O
tensorblock
81
1
Meta Llama 3.3 70B Instruct AWQ INT4
Llama 3.3 70B Instruct AWQ INT4 是 Meta Llama 3.3 70B Instruct 模型的 4 位量化版本,适用于多语言对话用例,优化了文本生成任务。
大型语言模型
Transformers

支持多种语言
M
ibnzterrell
6,410
22
Glm 4 9b Chat Hf
其他
GLM-4-9B是智谱AI推出的GLM-4系列最新一代预训练模型的开源版本,具备卓越的语义、数学、推理、代码和知识能力。
大型语言模型
Transformers

支持多种语言
G
THUDM
7,919
13
Qwen2.5 32B AGI
Apache-2.0
首个Qwen2.5 32B微调版本,旨在修复其过度审查炎症问题,支持多语言交互。
大型语言模型
Transformers

支持多种语言
Q
AiCloser
163
87
Vapor V2 7B
Apache-2.0
基于Qwen/Qwen2.5-7B模型在多语言数据集上微调的大语言模型,支持13种语言处理
大型语言模型
Transformers

V
FourOhFour
60
4
Llama 3.1 8B Instruct GGUF
Meta Llama 3.1 8B Instruct 是一个多语言大语言模型,针对多语言对话用例进行了优化,在常见的行业基准测试中表现优异。
大型语言模型
英语
L
modularai
9.7M
4
Internlm2 5 20b Chat Abliterated
Apache-2.0
这是一个基于internlm2_5-20b-chat模型进行消融处理的版本,使用CPU进行消融处理的新方法。
大型语言模型
Transformers

支持多种语言
I
byroneverson
16
4
Meta Llama 3.1 8B Instruct GPTQ INT4
这是Meta-Llama-3.1-8B-Instruct模型的INT4量化版本,使用GPTQ算法进行量化,适用于多语言对话场景。
大型语言模型
Transformers

支持多种语言
M
hugging-quants
128.18k
25
Meta Llama 3.1 8B Instruct GGUF
Meta Llama 3.1 8B 指令调优模型的 GGUF 量化版本,适用于多语言对话场景
大型语言模型
支持多种语言
M
MaziyarPanahi
499.87k
19
Meta Llama 3.1 70B Instruct AWQ INT4
Llama 3.1 70B Instruct的INT4量化版本,基于AutoAWQ技术优化,适用于多语言对话场景。
大型语言模型
Transformers

支持多种语言
M
hugging-quants
80.59k
100
Meta Llama 3.1 8B Instruct AWQ INT4
Llama 3.1 8B Instruct的INT4量化版本,基于AutoAWQ工具进行量化,适用于多语言对话场景。
大型语言模型
Transformers

支持多种语言
M
hugging-quants
348.23k
67
Deepseek V2 Chat GGUF
MIT
DeepSeek-V2-Chat 的 GGUF 量化版本,适用于本地部署和运行。
大型语言模型
支持多种语言
D
leafspark
1,388
27
Cymist2 V01 SFT
Apache-2.0
Cymist2-v0.1是由Cypien AI团队开发的先进语言模型,专为土耳其语和英语的文本生成任务优化,支持检索增强生成(RAG)和监督微调(SFT)。
大型语言模型
Transformers

支持多种语言
C
cypienai
2,729
2
Yuna Ai V3
Yuna AI是一个设计用于情感连接的虚拟伴侣模型,提供超越传统助手的深度互动体验。
大型语言模型
支持多种语言
Y
yukiarimo
139
10
Llama 3 Korean Bllossom 8B
Bllossom是基于Llama3的韩英双语语言模型,通过全面调优增强韩语能力,扩展了韩语词汇并优化了韩语上下文处理能力。
大型语言模型
Transformers

支持多种语言
L
MLP-KTLim
26.67k
333
Suzume Llama 3 8B Multilingual
其他
Suzume 8B是基于Llama 3的多语言微调版本,在近90,000个多语言对话上进行训练,增强了多语言交流能力,同时保持了Llama 3的智能水平。
大型语言模型
Transformers

S
lightblue
9,494
112
- 1
- 2
精选推荐AI模型
Llama 3 Typhoon V1.5x 8b Instruct
专为泰语设计的80亿参数指令模型,性能媲美GPT-3.5-turbo,优化了应用场景、检索增强生成、受限生成和推理任务
大型语言模型
Transformers

支持多种语言
L
scb10x
3,269
16
Cadet Tiny
Openrail
Cadet-Tiny是一个基于SODA数据集训练的超小型对话模型,专为边缘设备推理设计,体积仅为Cosmo-3B模型的2%左右。
对话系统
Transformers

英语
C
ToddGoldfarb
2,691
6
Roberta Base Chinese Extractive Qa
基于RoBERTa架构的中文抽取式问答模型,适用于从给定文本中提取答案的任务。
问答系统
中文
R
uer
2,694
98
AIbase是一个专注于MCP服务的平台,为AI开发者提供高质量的模型上下文协议服务,助力AI应用开发。
简体中文