128k长上下文

# 128k长上下文

Devstral Small 2507 FP8

Devstral是一款专为软件工程任务打造的大语言模型，由Mistral AI和All Hands AI合作开发，擅长代码探索、多文件编辑和工具调用。

大型语言模型

Safetensors 支持多种语言

Devstral Small 2507 GGUF

Devstral 1.1是专为软件工程任务设计的大语言模型，支持工具调用和视觉功能，适合代码库探索和多文件编辑。

大型语言模型支持多种语言

Devstral Small 2507

Devstral是一款专为软件工程任务打造的智能大语言模型，由Mistral AI和All Hands AI合作开发。它擅长利用工具探索代码库、编辑多个文件，并为软件工程智能体提供强大支持。

大型语言模型

Safetensors 支持多种语言

Devstral Small 2505 GGUF

专为软件工程项目打造的高效语言模型，轻量级设计，支持128k大上下文窗口，适用于复杂编码任务。

大型语言模型支持多种语言

Devstral Small 2505 Unsloth Bnb 4bit

Devstral是由Mistral AI和All Hands AI合作开发的软件工程任务代理型大语言模型，擅长使用工具探索代码库、编辑多个文件以及驱动软件工程代理。

大型语言模型

Safetensors 支持多种语言

Devstral Small 2505 GGUF

Devstral是一款专为软件工程任务设计的智能LLM，由Mistral AI和All Hands AI合作开发，擅长代码探索、多文件编辑和驱动软件工程代理。

大型语言模型支持多种语言

KernelLLM是基于Llama 3.1 Instruct微调的模型，专门用于编写使用Triton的GPU内核。

大型语言模型

lmstudio-community

Devstral Small 2505

Devstral是由Mistral AI与All Hands AI合作开发的面向软件工程任务的智能大语言模型，擅长代码库探索、多文件编辑和驱动软件工程代理。

大型语言模型

Safetensors 支持多种语言

Xgen Small 9B Instruct R

xGen-small是一款企业级紧凑型语言模型，通过领域聚焦的数据整理、可扩展的预训练、长度扩展和强化学习微调，以可预测的低成本实现长上下文性能表现。

大型语言模型

Transformers 英语

Qwen2.5 VL 72B Instruct GGUF

通义千问推出的多模态大模型，支持图像文本生成和128k长上下文处理，具备多语言能力。

图像生成文本英语

lmstudio-community

Zero Mistral 24B

Zero-Mistral-24B是基于Mistral-Small-3.1-24B-Instruct-2503改进的纯文本模型，主要适配俄语和英语，移除了原版的视觉功能，专注于文本生成任务。

大型语言模型

Transformers 支持多种语言

Pixtral 12b GGUF

Mistral-Community推出的多模态大模型，支持图像和文本处理，具备128k上下文长度和可变图像尺寸处理能力。

图像生成文本

lmstudio-community

xLAM-2是Salesforce研发的大型动作模型系列，专注于多轮对话和函数调用能力，可作为AI代理的核心组件。

大型语言模型

Transformers 英语

Llama 3.1 405B Instruct

Llama 3.1是由Meta开发的多语言大语言模型系列，包含8B、70B和405B三种规模，支持多语言文本生成和代码生成任务。

大型语言模型

Transformers 支持多种语言

120亿参数大语言模型，专为速度、效率和上下文准确性优化，支持RAG增强技术和128k上下文窗口。

大型语言模型

riple-saanvi-lab

Qwen2.5 The Wisemen QwQ Deep Tiny Sherlock 32B

基于QwQ-32B推理与思维模型，融合了多个顶级推理模型的特色，专注于减少提示中的'过度思考'，适用于创意用例和深入推理。

大型语言模型

Transformers 其他

Llama3.1 MOE 4X8B Gated IQ Multi Tier COGITO Deep Reasoning 32B GGUF

一个具备可调节推理能力的混合专家(MoE)模型，通过4个8B模型的协作实现增强推理和文本生成能力

大型语言模型支持多种语言

Llama SEA LION V3.5 70B R

Llama-SEA-LION-v3.5-70B-R 是一个专为东南亚语言优化的混合功能大语言模型，支持13种语言，具备复杂推理和通用文本生成能力。

大型语言模型

Transformers 支持多种语言

Llama SEA LION V3.5 8B R

Llama-SEA-LION-v3.5-8B-R是一个针对东南亚语言优化的8B参数大型语言模型，支持13种东南亚语言，具备复杂推理和通用文本生成能力。

大型语言模型

Transformers 支持多种语言

Cogito V1 Preview Qwen 32B Exl2 4.65bpw

Cogito v1 预览版是基于Qwen2.5-32B的指令调优生成式模型，支持30多种语言，上下文长度达128k，针对编程、STEM、指令遵循和通用帮助性进行了优化。

大型语言模型

Llama3.2 11B Vision Instruct INT4 GPTQ

Llama 3.2-Vision是Meta开发的多模态大语言模型，具备图像推理和文本生成能力，支持视觉识别、图像描述和问答等任务。

图像生成文本

Transformers 支持多种语言

xLAM-2系列是基于先进数据合成和训练流程构建的大型动作模型(LAMs)，专注于多轮对话和工具使用，在函数调用和代理任务中表现卓越。

大型语言模型

Transformers 英语

Xlam 2 32b Fc R

xLAM-2是Salesforce推出的新一代大型动作模型，专注于多轮对话和函数调用能力，能够将用户意图转化为可执行动作，作为AI代理的核心组件。

大型语言模型

Transformers 英语

Llama Xlam 2 8b Fc R

xLAM-2系列是基于APIGen-MT框架训练的大型动作模型，专注于多轮对话和函数调用能力，适用于AI代理开发。

大型语言模型

Transformers 英语

Llama Xlam 2 70b Fc R

xLAM-2是SalesforceAIResearch开发的大型动作模型(LAM)系列，专注于将用户意图转化为可执行动作，增强AI代理的决策能力。

大型语言模型

Transformers 英语

Gemma 3 Nine Rings Of Power Fiction Horror 4b It GGUF

基于Google Gemma-3模型，通过9种Neo和恐怖Imatrix方法微调，专注于恐怖和虚构内容生成

大型语言模型英语

Qwen2.5 MOE 2X1.5B DeepSeek Uncensored Censored 4B Gguf

这是一个Qwen2.5 MOE（专家混合）模型，由两个Qwen 2.5 DeepSeek（审查版/普通版和无审查版）1.5B模型组成，形成一个4B模型，其中无审查版本的DeepSeek Qwen 2.5 1.5B主导模型行为。

大型语言模型支持多种语言

Reasoningcore 3B R01

ReasoningCore‑3B 是由 EpitemeAI 开发的多语言、推理能力增强的大语言模型，在推理、对话管理、检索和总结任务中表现出色。

大型语言模型

Transformers 英语

Llama 3.2 11b Vision R1 Distill

Llama 3.2-Vision是由Meta开发的多模态大语言模型，支持图像和文本输入，针对视觉识别、图像推理和描述任务进行了优化。

图像生成文本

Transformers 支持多种语言

Meta Llama 3.1 8B Instruct FP16

Llama 3.1是Meta开发的多语言大语言模型集合，包含8B、70B和405B参数版本，支持8种语言，针对对话用例优化。

大型语言模型

Safetensors 支持多种语言

Llama SEA LION V3 8B IT

SEA-LION是一系列为东南亚地区预训练和指令微调的大语言模型，致力于解决该地区多语言处理问题，为东南亚语言的自然语言处理提供强大支持。

大型语言模型

Transformers 支持多种语言

Llama 3.3 70B Instruct FP8 Dynamic

Meta推出的70B参数多语言大语言模型，支持多种语言对话和工具调用，在行业基准测试中表现优异。

大型语言模型

Transformers 支持多种语言

L3.2 Rogue Creative Instruct Uncensored 7B GGUF

基于Llama 3.2架构的7B参数无审查创意写作模型，支持128k上下文长度，专为小说创作、情节生成和角色扮演优化

大型语言模型英语

Llama 3.2 3B Instruct AWQ

Llama 3.2是Meta推出的多语言大语言模型集合，包含1B和3B参数规模的预训练和指令调优版本，针对多语言对话用例优化，支持8种官方语言。

大型语言模型

Transformers 支持多种语言

Llama 3.2 3B Instruct

Llama 3.2 是 Meta 推出的多语言大语言模型集合，包含 1B 和 3B 大小的预训练和指令调优生成模型。它针对多语言对话用例进行了优化，在常见行业基准测试中表现出色。

大型语言模型

Transformers 支持多种语言

Llama 3.2 1B Instruct

Llama 3.2是一组预训练和指令调优的生成模型，包含1B和3B规模，针对多语言对话用例进行了优化，包括代理检索和摘要任务。

大型语言模型

Transformers 支持多种语言

Vikhr Nemo 12B Instruct R 21 09 24

Vikhr-Nemo是基于Mistral-Nemo-Instruct-2407优化的双语大语言模型，专为俄语和英语优化，支持逻辑推理、文本摘要、代码生成等多种任务。

大型语言模型

Transformers 支持多种语言

Llama 3.2 90B Vision Instruct

Llama 3.2-Vision是Meta开发的多模态大语言模型，支持图像和文本输入，文本输出，在视觉识别、图像推理、图像描述和图像问答任务上表现优异。

图像生成文本

Transformers 支持多种语言

Llama 3.2 11B Vision

Llama 3.2-Vision是由Meta开发的多模态大语言模型系列，包含11B和90B两种规模，支持图像+文本输入和文本输出，针对视觉识别、图像推理、图像描述和图像问答任务进行了优化。

图像生成文本

Transformers 支持多种语言

Llama 3.2是Meta开发的多语言大语言模型系列，包含1B和3B规模的预训练及指令调优生成模型，针对多语言对话场景优化，支持文本输入/输出。

大型语言模型

Transformers 支持多种语言

精选推荐AI模型

Llama 3 Typhoon V1.5x 8b Instruct

专为泰语设计的80亿参数指令模型，性能媲美GPT-3.5-turbo，优化了应用场景、检索增强生成、受限生成和推理任务

大型语言模型

Transformers 支持多种语言

Cadet-Tiny是一个基于SODA数据集训练的超小型对话模型，专为边缘设备推理设计，体积仅为Cosmo-3B模型的2%左右。

Transformers 英语

Roberta Base Chinese Extractive Qa

基于RoBERTa架构的中文抽取式问答模型，适用于从给定文本中提取答案的任务。

问答系统中文

AIbase

智启未来，您的人工智能解决方案智库

简体中文

© 2025AIbase 备案号：闽ICP备08105208号-24