FP8高效推理

# FP8高效推理

Qwen3 235B A22B FP8

Qwen3是通义千问系列大语言模型的最新版本，提供稠密模型与混合专家（MoE）模型的完整套件。基于大规模训练，Qwen3在推理、指令遵循、智能体能力和多语言支持方面实现突破性进展。

大型语言模型

Qwen3是通义千问系列大语言模型的最新版本，提供全系列稠密模型和混合专家（MoE）模型，在推理、指令遵循、智能体能力和多语言支持方面取得突破性进展。

大型语言模型

Qwen3-4B-FP8是通义千问系列最新的大语言模型，提供40亿参数的FP8量化版本，支持思维与非思维模式切换，在推理、指令遵循和智能体能力方面表现卓越。

大型语言模型

Qwen3-1.7B-FP8 是 Qwen 系列最新一代大语言模型的 FP8 版本，具备强大的推理、指令遵循、智能体交互和多语言支持能力。

大型语言模型

基于腾讯混元视频模型的动漫风格适配器，提供高质量文本到视频生成能力，特别优化了动漫风格内容生成。

文本生成视频英语

腾讯开源的大规模视频生成模型，支持文本到视频生成，性能媲美主流闭源模型。

文本生成视频

Uncensored Females Flux Fluxdevufv7fp16 Fp8 Flux

FLUX.1-dev 是一个基于 diffusers 库的文本到图像生成模型，专注于开发阶段的 FP8 浮点运算优化，能够生成逼真且照片级真实感的图像。

图像生成英语

Nsfw Master Flux Lora Merged With Flux1 Dev Fp16 V10 Fp8 Flux

FLUX.1-dev 是一个实验性的文本生成图像模型，专注于照片级真实感的写实风格图像生成。

文本生成图像英语

Mistral 7B Instruct V0.2 Fp8

由FriendliAI量化为FP8精度的Mistral-7B-Instruct-v0.2模型，在保持高精度的同时显著提升推理效率。

大型语言模型

精选推荐AI模型

Llama 3 Typhoon V1.5x 8b Instruct

专为泰语设计的80亿参数指令模型，性能媲美GPT-3.5-turbo，优化了应用场景、检索增强生成、受限生成和推理任务

大型语言模型

Transformers 支持多种语言

Cadet-Tiny是一个基于SODA数据集训练的超小型对话模型，专为边缘设备推理设计，体积仅为Cosmo-3B模型的2%左右。

Transformers 英语

Roberta Base Chinese Extractive Qa

基于RoBERTa架构的中文抽取式问答模型，适用于从给定文本中提取答案的任务。

问答系统中文

AIbase

智启未来，您的人工智能解决方案智库

简体中文

© 2025AIbase 备案号：闽ICP备08105208号-24