FP8高效推理
Qwen3 235B A22B FP8
Apache-2.0
Qwen3是通义千问系列大语言模型的最新版本,提供稠密模型与混合专家(MoE)模型的完整套件。
大型语言模型
Transformers
Q
Qwen
47.30k
68
Qwen3 14B FP8
Apache-2.0
Qwen3是通义千问系列大语言模型的最新版本,提供全系列稠密模型和混合专家(MoE)模型,在推理、指令遵循、智能体能力和多语言支持方面取得突破性进展。
大型语言模型
Transformers
Q
Qwen
16.28k
19
Qwen3 4B FP8
Apache-2.0
Qwen3-4B-FP8是通义千问系列最新的大语言模型,提供40亿参数的FP8量化版本,支持思维与非思维模式切换,在推理、指令遵循和智能体能力方面表现卓越。
大型语言模型
Transformers
Q
Qwen
23.95k
22
Hyvid
MIT
基于腾讯混元视频模型的动漫风格适配器,提供高质量文本到视频生成能力,特别优化了动漫风格内容生成。
文本生成视频
英语
H
calcuis
1,392
20
Hunyuanvideo
其他
腾讯开源的大规模视频生成模型,支持文本到视频生成,性能媲美主流闭源模型。
文本生成视频
H
tencent
2,285
1,837
Uncensored Females Flux Fluxdevufv7fp16 Fp8 Flux
其他
FLUX.1-dev 是一个基于 diffusers 库的文本到图像生成模型,专注于开发阶段的 FP8 浮点运算优化,能够生成逼真且照片级真实感的图像。
图像生成
英语
U
John6666
102
8
Nsfw Master Flux Lora Merged With Flux1 Dev Fp16 V10 Fp8 Flux
其他
FLUX.1-dev 是一个实验性的文本生成图像模型,专注于照片级真实感的写实风格图像生成。
文本生成图像
英语
N
John6666
311
7
Mistral 7B Instruct V0.2 Fp8
Apache-2.0
由FriendliAI量化为FP8精度的Mistral-7B-Instruct-v0.2模型,在保持高精度的同时显著提升推理效率。
大型语言模型
Transformers
M
FriendliAI
37
12