多语言推理

# 多语言推理

Tri-21B是一款旗舰级大语言模型，仅使用2T训练令牌便达到最先进性能，重新定义了训练效率边界。

大型语言模型

Transformers 支持多种语言

SmolLM3是一款参数为30亿的语言模型，旨在突破小模型的性能边界。它支持6种语言，具备高级推理能力和长上下文处理能力，是一个完全开源的模型。

大型语言模型

Transformers 支持多种语言

Helpingai Dhanishtha 2.0 Preview GGUF

基于HelpingAI的Dhanishtha-2.0-preview模型进行量化处理的多语言文本生成模型，支持推理、对话等多种场景。

大型语言模型

Transformers 支持多种语言

Smollm3 3B Base

SmolLM3是一款拥有30亿参数的开源语言模型，支持6种语言，具备强大的推理能力和长上下文处理能力。

大型语言模型

Transformers 支持多种语言

Phi 3.5 Mini Instruct

Phi-3.5-mini-instruct是一款轻量级、先进的开源模型，基于Phi-3使用的数据集构建，专注于高质量、富含推理的数据。支持128K令牌上下文长度，具有强大的多语言能力和长上下文处理能力。

大型语言模型

Transformers 其他

Llama 3.1 Nemotron Nano 4B V1.1 GGUF

Llama-3.1-Nemotron-Nano-4B-v1.1是一款基于Llama 3.1优化的大语言模型，在准确性和效率间取得良好平衡，适用于AI代理、聊天机器人等多种场景。

大型语言模型

Transformers 英语

Qwen3 0.6B Llamafile

Qwen3是Qwen系列最新一代的大语言模型，提供0.6B参数的密集模型，在推理、指令遵循、代理能力和多语言支持方面有突破性进展。

大型语言模型

Qwen3-4B是通义千问系列大语言模型的最新版本，具有4B参数规模，支持思维与非思维模式切换，擅长推理、指令遵循和多语言处理。

大型语言模型

Qwen3 0.6B GGUF

Qwen3-0.6B 是 Qwen 系列最新一代的 0.6B 参数规模的大语言模型，支持思维和非思维模式切换，具备强大的推理、指令遵循和多语言能力。

大型语言模型

Falcon H1 34B Instruct GPTQ Int8

猎鹰-H1是由TII开发的高性能混合架构语言模型，结合了Transformers和Mamba架构的优势，支持英语和多语言任务。

大型语言模型

Qwen3 30B A3B GGUF

Qwen3是Qwen系列最新一代的大语言模型，提供了一系列密集和混合专家(MoE)模型，在推理、指令遵循、代理能力和多语言支持方面取得了突破性进展。

大型语言模型英语

Qwen3 235B A22B GPTQ Int4

Qwen3是Qwen系列最新一代的大语言模型，提供了一系列密集和混合专家（MoE）模型。基于广泛的训练，Qwen3在推理、指令遵循、代理能力和多语言支持方面取得了突破性进展。

大型语言模型

Qwen3 235B A22B

Qwen3 是 Qwen 系列最新一代的大语言模型，提供了一系列密集和混合专家（MoE）模型。基于广泛的训练，Qwen3 在推理、指令遵循、代理能力和多语言支持方面取得了突破性进展。

大型语言模型

Qwen3 1.7B GPTQ Int8

Qwen3是通义千问系列大语言模型的最新版本，提供17亿参数的GPTQ 8位量化模型，支持思维与非思维模式切换，增强推理能力和多语言支持。

大型语言模型

Qwen3 1.7B GGUF

通义千问系列大语言模型的最新版本，支持思维与非思维模式切换，具备强大的推理、多语言和智能体能力。

大型语言模型

Qwen3是通义千问系列大语言模型的最新版本，提供了一系列密集型和混合专家（MoE）模型。基于大规模训练，Qwen3在推理、指令遵循、智能体能力和多语言支持方面取得了突破性进展。

大型语言模型

Qwen3 235B A22B AWQ

Qwen3-235B-A22B是Qwen系列最新一代的大语言模型，采用混合专家(MoE)架构，具有2350亿参数和220亿激活参数，在推理、指令遵循、代理能力和多语言支持方面表现卓越。

大型语言模型

cognitivecomputations

Falcon H1 7B Instruct

Falcon-H1是由TII开发的高效混合架构语言模型，结合Transformers与Mamba架构优势，支持英语及多语言任务。

大型语言模型

Falcon H1 3B Instruct

猎鹰-H1是由TII开发的混合Transformers+Mamba架构的因果解码器专用语言模型，支持英语和多语言任务。

大型语言模型

Falcon H1 1.5B Deep Instruct

猎鹰-H1是由阿联酋技术创新研究院开发的混合Transformer与曼巴架构的因果解码器模型，支持英语和多语种任务。

大型语言模型

Falcon H1 1.5B Instruct

猎鹰-H1是由TII开发的高效混合架构语言模型，结合了Transformers和Mamba架构的优势，支持英语和多语言任务。

大型语言模型

Falcon H1 7B Base

Falcon-H1是由TII开发的混合Transformers + Mamba架构的因果解码器专用语言模型，支持多语言处理，性能优异。

大型语言模型

Transformers 支持多种语言

Falcon H1 1.5B Base

Falcon-H1是由TII开发的混合Transformers + Mamba架构的仅解码因果模型，支持英语和多语言任务。

大型语言模型

Transformers 支持多种语言

Qwen3 8B GPTQ Int4

Qwen3-4B是Qwen系列的最新大语言模型，具备思维模式切换能力、强大的推理能力、出色的人类偏好对齐、卓越的智能体能力以及多语言支持。

大型语言模型

Qwen3 32B GPTQ Int8

Qwen3-8B 是 Qwen3 系列中的一款大语言模型，具备因果语言模型的特性，在推理、多语言支持、智能体能力等方面表现出色，能为用户带来自然、流畅的对话体验。

大型语言模型

Qwen3 14B 128K GGUF

Qwen3是Qwen系列最新一代的大语言模型，提供了一系列密集和混合专家（MoE）模型。基于广泛的训练，Qwen3在推理、指令遵循、代理能力和多语言支持方面实现了突破性进展。

大型语言模型英语

Qwen3 30B A3B 128K GGUF

Qwen3是通义千问系列最新一代大语言模型，提供完整的稠密与混合专家(MoE)模型体系。基于海量训练，Qwen3在推理、指令跟随、智能体能力和多语言支持方面实现突破性进展。

大型语言模型英语

Qwen3是由Qwen团队开发的一系列先进语言模型，在高级推理、对话、指令遵循和智能体应用等方面表现卓越。

大型语言模型

Qwen3 32B 128K GGUF

Qwen3是Qwen系列最新一代的大语言模型，提供了一系列密集和混合专家（MoE）模型。基于广泛的训练，Qwen3在推理、指令遵循、代理能力和多语言支持方面取得了突破性进展。

大型语言模型英语

Qwen3 8B 128K GGUF

Qwen3是通义千问系列大语言模型的最新8B参数版本，支持思维与非思维模式切换，具备128K上下文长度和卓越的多语言能力。

大型语言模型英语

Qwen3 235B A22B 128K GGUF

Qwen3是通义千问系列最新一代大语言模型，提供完整的稠密和混合专家(MoE)模型套件。基于大规模训练，Qwen3在推理、指令遵循、智能体能力和多语言支持方面取得突破性进展。

大型语言模型英语

Qwen3 235B A22B GGUF

Qwen3是Qwen系列最新一代的大语言模型，提供了一系列密集和混合专家（MoE）模型。基于广泛的训练，Qwen3在推理、指令遵循、代理能力和多语言支持方面实现了突破性进展。

大型语言模型英语

Qwen3是Qwen系列最新一代的大语言模型，提供了一系列密集和混合专家(MoE)模型。基于广泛的训练，Qwen3在推理、指令遵循、代理能力和多语言支持方面取得了突破性进展。

大型语言模型英语

Qwen3 30B A3B FP8

Qwen3是通义千问系列最新一代大语言模型，提供稠密模型和混合专家(MoE)模型的完整套件。基于大规模训练，Qwen3在推理、指令遵循、智能体能力和多语言支持方面取得突破性进展。

大型语言模型

Qwen3 4B 128K GGUF

Qwen3-4B是Qwen系列最新一代的大语言模型，具有4B参数规模，支持100多种语言，在推理、指令遵循、代理能力和多语言支持方面表现优异。

大型语言模型英语

Qwen3-4B-FP8是通义千问系列最新的大语言模型，提供40亿参数的FP8量化版本，支持思维与非思维模式切换，在推理、指令遵循和智能体能力方面表现卓越。

大型语言模型

Qwen3 1.7B Unsloth Bnb 4bit

Qwen3-1.7B是通义千问系列最新一代大语言模型中的17亿参数版本，支持思维模式切换、多语言处理和智能体能力。

大型语言模型

Transformers 英语

Qwen3 1.7B GGUF

Qwen3-1.7B是Qwen系列最新一代1.7B参数规模的大语言模型，支持在思考与非思考模式间切换，具备增强的推理能力和多语言支持。

大型语言模型英语

Qwen3 0.6B Unsloth Bnb 4bit

Qwen3是Qwen系列最新一代的大语言模型，提供了一套全面的密集和混合专家（MoE）模型。基于广泛的训练，Qwen3在推理、指令遵循、代理能力和多语言支持方面实现了突破性进展。

大型语言模型

Transformers 英语

Qwen3 0.6B GGUF

Qwen3-0.6B是阿里云开发的0.6B参数规模的大语言模型，属于Qwen3系列的最新成员，支持100多种语言，具备强大的推理、指令遵循和多语言能力。

大型语言模型英语

精选推荐AI模型

Llama 3 Typhoon V1.5x 8b Instruct

专为泰语设计的80亿参数指令模型，性能媲美GPT-3.5-turbo，优化了应用场景、检索增强生成、受限生成和推理任务

大型语言模型

Transformers 支持多种语言

Cadet-Tiny是一个基于SODA数据集训练的超小型对话模型，专为边缘设备推理设计，体积仅为Cosmo-3B模型的2%左右。

Transformers 英语

Roberta Base Chinese Extractive Qa

基于RoBERTa架构的中文抽取式问答模型，适用于从给定文本中提取答案的任务。

问答系统中文

AIbase

智启未来，您的人工智能解决方案智库

简体中文

© 2025AIbase 备案号：闽ICP备08105208号-24