大上下文窗口

# 大上下文窗口

Gemma 3n E4B It GGUF

Gemma-3n-E4B-it 是 Google 发布的轻量级语言模型，基于 transformers 库，适用于图像文本转文本任务。

大型语言模型

Gemma 3 4B It Qat GGUF

Google出品的Gemma 3 4B IT模型，支持多模态输入和长上下文处理，适用于文本生成和图像理解任务。

图像生成文本

lmstudio-community

Llavaguard V1.2 0.5B OV Hf

LlavaGuard-v1.2-0.5B-OV是一个基于图像文本的模型，专注于内容安全评估，面向研究人员设计。

图像生成文本

EEVE Korean Instruct 10.8B V1.0 Gguf

EEVE-Korean-Instruct-10.8B-v1.0 是一个韩语指令微调的大型语言模型，基于 yanolja/EEVE-Korean-10.8B-v1.0 基础模型开发，专注于韩语理解和生成任务。

大型语言模型

Tweety 7b Dutch V24a

Tweety-7b-dutch是一个专注于荷兰语的基础大语言模型，基于mistral架构，使用荷兰语分词器优化荷兰语文本处理能力。

大型语言模型

Transformers 其他

金丝雀-750M是一个预训练的土耳其语GPT-J 750M模型，属于土耳其数据仓库计划的一部分。

大型语言模型其他

基于Qwen-14B在混合日语和英语数据集上持续预训练的大语言模型，显著提升日语任务表现

大型语言模型

Transformers 支持多种语言

基于Mistral 7B的大规模开源荷兰语模型，通过100亿荷兰语文本标记的增量训练，显著提升荷兰语理解能力及本土知识覆盖。

大型语言模型

Transformers 其他

Colossal LLaMA 2 7b Base

基于LLaMA-2的中英双语开源大语言模型，经过约85亿token的持续预训练，支持4096 token的上下文窗口。

大型语言模型

Transformers 支持多种语言

Starcoderbase 7b

StarCoderBase-7B是一个参数规模为70亿的代码生成模型，支持80多种编程语言，专注于代码补全和生成任务。

大型语言模型

Transformers 其他

Mpt 7b 8k Instruct

MPT-7B-Instruct-8k 是一款用于长格式指令遵循的模型，尤其擅长对较长文档进行问答和总结。

大型语言模型

Transformers 其他

Long T5 Tglobal Large Pubmed 3k Booksum 16384 WIP15

基于Long-T5架构的大规模摘要生成模型，专门针对书籍和长文档摘要任务进行优化

Long T5 Tglobal Base 16384 Booksum V12

基于T5架构优化的长文本摘要生成模型，支持处理长达16384个token的输入，在书籍摘要任务上表现优异。

Long T5 Tglobal Base 16384 Book Summary

基于Long-T5架构的书籍摘要生成模型，支持处理长文档并生成高质量摘要。

Long T5 Tglobal Large Pubmed 3k Booksum 16384 WIP

基于Long-T5架构的大规模摘要生成模型，专门针对长文档摘要任务优化，支持16384个token的上下文长度。

精选推荐AI模型

Llama 3 Typhoon V1.5x 8b Instruct

专为泰语设计的80亿参数指令模型，性能媲美GPT-3.5-turbo，优化了应用场景、检索增强生成、受限生成和推理任务

大型语言模型

Transformers 支持多种语言

Cadet-Tiny是一个基于SODA数据集训练的超小型对话模型，专为边缘设备推理设计，体积仅为Cosmo-3B模型的2%左右。

Transformers 英语

Roberta Base Chinese Extractive Qa

基于RoBERTa架构的中文抽取式问答模型，适用于从给定文本中提取答案的任务。

问答系统中文

AIbase

智启未来，您的人工智能解决方案智库

简体中文

© 2025AIbase 备案号：闽ICP备08105208号-24