32K长文本处理

# 32K长文本处理

Kanana 1.5 8b Instruct 2505 GGUF

Kanana 1.5 是 Kanana 模型系列的新版本，在编码、数学和函数调用能力方面有显著提升，能够处理长达32K个令牌的输入，使用YaRN时可处理多达128K个令牌。

大型语言模型

Transformers 支持多种语言

Kanana 1.5 8b Instruct 2505

Kanana 1.5是Kanana模型家族的新版本，在编码、数学和函数调用能力方面相比前代有显著提升，支持32K tokens长度并可扩展至128K tokens。

大型语言模型

Transformers 支持多种语言

Qwen3 235B A22B GGUF

Qwen3是通义千问系列大语言模型的最新版本，提供稠密模型与混合专家（MoE）模型的完整套件。基于海量训练数据，Qwen3在推理能力、指令遵循、智能体功能及多语言支持方面实现突破性进展。

大型语言模型

Qwen3-32B-AWQ是通义千问系列最新一代32.8B参数的大语言模型，采用AWQ 4-bit量化技术，支持思维与非思维模式切换，具备卓越的推理、指令遵循和智能体能力。

大型语言模型

基于Hugging Face transformers库的4B参数大语言模型，支持文本生成、思维模式切换、工具调用和长文本处理等功能。

大型语言模型

Qwen3 235B A22B FP8

Qwen3是通义千问系列大语言模型的最新版本，提供稠密模型与混合专家（MoE）模型的完整套件。基于大规模训练，Qwen3在推理、指令遵循、智能体能力和多语言支持方面实现突破性进展。

大型语言模型

Qwen3-32B-FP8是通义千问系列最新一代32.8B参数大语言模型，支持思维与非思维模式切换，具备卓越的推理、指令遵循和智能体能力。

大型语言模型

Qwen3是通义千问系列大语言模型的最新版本，提供全系列稠密模型和混合专家（MoE）模型，在推理、指令遵循、智能体能力和多语言支持方面取得突破性进展。

大型语言模型

Qwen3-8B-FP8是通义千问系列大语言模型的最新版本，提供FP8量化版本，支持思维模式与非思维模式的无缝切换，具备强大的推理能力和多语言支持。

大型语言模型

Qwen3 32B Unsloth Bnb 4bit

Qwen3是通义千问系列大语言模型的最新版本，提供32.8B参数的密集模型，在推理能力、指令遵循、智能体功能和多语言支持方面实现突破性进展。

大型语言模型

Transformers 英语

Qwen3是阿里云开发的大规模语言模型系列的最新版本，具有卓越的推理、指令跟随和多语言支持能力。32B版本是其密集模型之一，支持在思考与非思考模式间切换。

大型语言模型英语

Qwen3是通义千问系列最新一代大语言模型，提供完整的稠密模型和专家混合(MoE)模型组合。基于大规模训练，Qwen3在推理、指令遵循、智能体能力和多语言支持方面实现突破性进展。

大型语言模型

Kanana 1.5 8b Base

Kanana 1.5是Kakao公司开发的双语大语言模型，支持英文和韩文，在编程、数学和函数调用能力方面有显著提升，原生支持32K tokens上下文长度

大型语言模型

Transformers 支持多种语言

Falcon3-10B-Instruct是Falcon3系列的开源基础模型，拥有100亿参数，专注于高质量指令跟随任务，支持多语言处理，上下文长度可达32K tokens。

大型语言模型

Midnight Miqu 103B V1.5

基于Miqu的103B混合模型，支持32K上下文长度，仅限个人使用

大型语言模型

PULI LlumiX 32K

PULI LlumiX 32K 是一个基于LLaMA-2-7B-32K的大语言模型，经过匈牙利语和英语数据集的持续预训练，支持32K上下文长度。

大型语言模型

Transformers 支持多种语言

Midnight Miqu 103B V1.0

基于Miqu泄露模型的103B参数混合模型，支持32K上下文长度

大型语言模型

sophosympatheia

精选推荐AI模型

Llama 3 Typhoon V1.5x 8b Instruct

专为泰语设计的80亿参数指令模型，性能媲美GPT-3.5-turbo，优化了应用场景、检索增强生成、受限生成和推理任务

大型语言模型

Transformers 支持多种语言

Cadet-Tiny是一个基于SODA数据集训练的超小型对话模型，专为边缘设备推理设计，体积仅为Cosmo-3B模型的2%左右。

Transformers 英语

Roberta Base Chinese Extractive Qa

基于RoBERTa架构的中文抽取式问答模型，适用于从给定文本中提取答案的任务。

问答系统中文

AIbase

智启未来，您的人工智能解决方案智库

简体中文

© 2025AIbase 备案号：闽ICP备08105208号-24