超长上下文理解

# 超长上下文理解

Llama 4 Maverick 17B 128E Instruct FP8

Llama 4系列原生多模态AI模型，支持文本和图像理解，采用混合专家架构，适用于商业和研究场景。

多模态融合

Transformers 支持多种语言

Llama 4 Maverick 17B 128E Instruct

Llama 4 Maverick是Meta推出的170亿参数混合专家架构（MoE）多模态模型，支持12种语言和图像理解，适用于商业与研究用途。

多模态融合

Transformers 支持多种语言

Qwen3 30B A3B Base

Qwen3-30B-A3B-Base是Qwen系列最新一代大语言模型，在训练数据、模型架构和优化技术等方面有诸多改进，提供更强大的语言处理能力。

大型语言模型

Llama 4 Scout 17B 16E Instruct Bnb 8bit

Llama 4系列是Meta开发的多模态AI模型，支持文本与图像交互，采用混合专家架构(MoE)，在文本和图像理解领域具有领先性能。

多模态融合

Transformers 支持多种语言

Llama 4 Scout 17B 16E Unsloth

Llama 4 Scout是Meta推出的170亿参数多模态AI模型，采用混合专家架构，支持12种语言和图像理解。

文本生成图像

Transformers 支持多种语言

Meta Llama Llama 4 Maverick 17B 128E Instruct

Llama 4 Maverick 是 Meta 发布的多模态 AI 模型，支持文本与图像理解，采用混合专家架构（MoE），在多语言文本和代码生成任务中表现优异。

多模态融合

Transformers 支持多种语言

Llama 3.1 8B UltraLong 4M Instruct

专为处理超长文本序列（最高支持100万、200万和400万标记）设计的大语言模型，在标准基准测试中保持卓越性能

大型语言模型

Transformers 英语

Llama 3.1 Nemotron 8B UltraLong 4M Instruct

Nemotron-UltraLong-8B是专为处理超长文本序列设计的语言模型，支持最高400万标记的上下文窗口，同时在标准基准测试中保持卓越性能。

大型语言模型

Transformers 英语

Llama 3.1 8B UltraLong 1M Instruct

Nemotron-UltraLong-8B系列是专为处理超长文本序列设计的语言模型，支持最高400万token的上下文窗口，同时保持卓越性能。

大型语言模型

Transformers 英语

Llama 3.1 Nemotron 8B UltraLong 1M Instruct

专为处理超长文本序列（最高支持100万、200万和400万标记）设计的大语言模型，在标准基准测试中保持卓越性能。

大型语言模型

Transformers 英语

精选推荐AI模型

Llama 3 Typhoon V1.5x 8b Instruct

专为泰语设计的80亿参数指令模型，性能媲美GPT-3.5-turbo，优化了应用场景、检索增强生成、受限生成和推理任务

大型语言模型

Transformers 支持多种语言

Cadet-Tiny是一个基于SODA数据集训练的超小型对话模型，专为边缘设备推理设计，体积仅为Cosmo-3B模型的2%左右。

Transformers 英语

Roberta Base Chinese Extractive Qa

基于RoBERTa架构的中文抽取式问答模型，适用于从给定文本中提取答案的任务。

问答系统中文

AIbase

智启未来，您的人工智能解决方案智库

简体中文

© 2025AIbase 备案号：闽ICP备08105208号-24