超长上下文推理

# 超长上下文推理

Qwen3 30B A3B GPTQ Int4

Qwen3是通义千问系列大语言模型的最新版本，提供稠密模型与混合专家（MoE）模型的完整组合，在推理、指令遵循、智能体能力和多语言支持方面实现了突破性进展。

大型语言模型

Qwen3 30B A3B GGUF

Qwen3是通义千问系列最新一代大语言模型，提供密集型和混合专家（MoE）模型的全面解决方案，在推理、指令遵循、智能体能力和多语言支持方面取得突破性进展。

大型语言模型

Qwen3 235B A22B INT4 W4A16

Qwen3是通义千问系列最新一代大语言模型，235B参数混合专家(MoE)模型，经INT4量化后显著降低内存占用

大型语言模型

Qwen3 4B Q8 0 64k 128k 256k Context GGUF

Qwen 4B模型的三种量化版本（Q8_0），分别支持64K、128K和256K的上下文长度，专为长文本生成和深度思考任务优化

大型语言模型

Qwen3 32B GPTQ Int4

Qwen3是通义千问系列大语言模型的最新8B参数版本，支持思维模式切换、多语言处理和工具调用，具备强大的推理和对话能力。

大型语言模型

Qwen团队推出的8B参数规模大语言模型，支持超长上下文和多种语言处理

大型语言模型

lmstudio-community

Qwen3 30B A3B GGUF

由Qwen开发的大语言模型，支持131,072 tokens上下文长度，擅长创意写作、角色扮演和多轮对话。

大型语言模型

lmstudio-community

Qwen3 235B A22B GGUF

Qwen团队推出的2350亿参数大语言模型量化版本，支持131k上下文长度和混合专家架构

大型语言模型

lmstudio-community

Llama 3 1 Nemotron Ultra 253B V1

基于Meta Llama-3.1-405B-Instruct衍生的大型语言模型，通过神经架构搜索技术优化，支持128K tokens上下文长度，适用于推理、对话和指令跟随任务。

大型语言模型

Transformers 英语

精选推荐AI模型

Llama 3 Typhoon V1.5x 8b Instruct

专为泰语设计的80亿参数指令模型，性能媲美GPT-3.5-turbo，优化了应用场景、检索增强生成、受限生成和推理任务

大型语言模型

Transformers 支持多种语言

Cadet-Tiny是一个基于SODA数据集训练的超小型对话模型，专为边缘设备推理设计，体积仅为Cosmo-3B模型的2%左右。

Transformers 英语

Roberta Base Chinese Extractive Qa

基于RoBERTa架构的中文抽取式问答模型，适用于从给定文本中提取答案的任务。

问答系统中文

AIbase

智启未来，您的人工智能解决方案智库

简体中文

© 2025AIbase 备案号：闽ICP备08105208号-24