知识密集型任务

# 知识密集型任务

Kakaocorp.kanana 1.5 8b Instruct 2505 GGUF

Kanana-1.5-8B-Instruct-2505 是由 Kakao Corp 开发的一个 8B 参数规模的指令微调语言模型，适用于文本生成任务。

大型语言模型

Bytedance Seed.academic Ds 9B GGUF

本项目提供了academic-ds-9B的量化版本，旨在让知识为每个人所用。

大型语言模型

Mlabonne.qwen3 30B A3B Abliterated GGUF

Qwen3-30B-A3B-abliterated 是一个基于 Qwen 架构的 300 亿参数大型语言模型，专注于文本生成任务。

大型语言模型

Allenai.olmo 2 0425 1B Instruct GGUF

OLMo-2-0425-1B-Instruct是由AllenAI开发的一个10亿参数规模的指令微调语言模型，专注于文本生成任务。

大型语言模型

Qwen 2.5 7B Base RAG RL

Qwen-2.5-7B-base-RAG-RL 是一个基于未知数据集从头开始训练的7B参数规模的大语言模型，结合了检索增强生成(RAG)和强化学习(RL)技术。

大型语言模型

Gemma 3 1B It Qat GGUF

Google推出的轻量级开源大语言模型，适用于多种文本生成任务

大型语言模型

lmstudio-community

THUDM.GLM 4 32B 0414 GGUF

GLM-4-32B-0414是由THUDM开发的大规模语言模型，具有320亿参数，适用于多种文本生成任务。

大型语言模型

Salesforce.llama Xlam 2 70b Fc R GGUF

Llama-xLAM-2-70b-fc-r 是由 Salesforce 发布的大型语言模型，基于 Llama 2 架构，具有 700 亿参数。

大型语言模型

YM 12B Model Stock

这是一个通过mergekit工具合并的12B参数规模的语言模型，基于EtherealAurora-12B-v2融合了多个优秀模型的特点

大型语言模型

ReasonIR-8B是首个专为通用推理任务训练的检索模型，在BRIGHT基准上实现了最先进的检索性能，并在RAG应用中显著提升了MMLU和GPQA基准的表现。

Transformers 英语

FANformer-1B是通过创新周期性机制增强语言建模能力的自回归模型，具有11亿非嵌入参数，训练token量达1万亿。

大型语言模型

Transformers 英语

Gemma 3 27b It Abliterated Q4 K M GGUF

该模型是基于mlabonne/gemma-3-27b-it-abliterated转换的GGUF格式版本，适用于llama.cpp框架的推理任务。

大型语言模型

Trillion 7B Preview

Trillion-7B预览版是一款多语言大型语言模型，支持英语、韩语、日语和中文，在保持较低计算量的同时实现了与更高计算量模型竞争的性能。

大型语言模型

Transformers 支持多种语言

Gemma 3 12b It Q5 K S GGUF

这是Google Gemma 3B模型的GGUF量化版本，适用于本地推理，支持文本生成任务。

大型语言模型

Gemma 3 12b It Q5 K M GGUF

这是由google/gemma-3-12b-it转换而来的GGUF格式模型，适用于llama.cpp框架。

大型语言模型

Gemma 3 27b It Q4 K M GGUF

该模型是基于Google的Gemma 3 27B IT模型转换而来的GGUF格式版本，适用于本地推理。

大型语言模型

paultimothymooney

Google.gemma 3 4b It GGUF

Gemma 3.4B IT 是 Google 开发的一个 34 亿参数的大语言模型，专注于指令调优版本，适用于多种自然语言处理任务。

大型语言模型

Llama 3.1 8b DodoWild V2.01

基于Llama 3.1架构的8B参数语言模型，通过mergekit合并多个模型而成，具备文本生成能力

大型语言模型

Huihui Ai.qwen2.5 14B Instruct 1M Abliterated GGUF

一个14B参数规模的大语言模型，专注于指令遵循任务，支持文本生成能力。

大型语言模型

Allenai.llama 3.1 Tulu 3.1 8B GGUF

Llama-3.1-Tulu-3.1-8B是由AllenAI开发的大语言模型，基于Llama架构，具有80亿参数，专注于文本生成任务。

大型语言模型

Deepseek R1 Distill Llama 70B GGUF

DeepSeek-R1-Distill-Llama-70B是DeepSeek团队基于Llama架构开发的70B参数大语言模型，通过蒸馏技术优化，支持高效推理和微调。

大型语言模型英语

Wiroai Turkish Llm 9b

WiroAI开发的基于Gemma-2-9b的土耳其语大语言模型，专注于对话生成任务

大型语言模型

Transformers 其他

Sapie Gemma2 9B IT

基于Google Gemma-2-9b-it模型优化的韩语版本，由Saltware开发，适用于韩语自然语言处理任务。

大型语言模型

Transformers 韩语

Nanolm 1B Instruct V1.1

NanoLM-1B-Instruct-v1.1是一个10亿参数规模的小型指令微调语言模型，支持多领域英文文本生成任务。

大型语言模型支持多种语言

Gemma 2 2b It Chinese Kyara Dpo

Kyara是一个通过知识检索增强的语言模型微调项目，专注于提升模型在繁体中文等资源较少语言上的表现。

大型语言模型

Transformers 支持多种语言

Jais Family 30b 16k Chat

Jais系列是专为阿拉伯语优化的双语大语言模型，同时具备强大的英语能力。30B-16K版本拥有300亿参数，支持16,384个token的上下文长度。

大型语言模型支持多种语言

Llama 3 Stinky V2 8B

这是一个基于Llama-3架构的8B参数模型，通过mergekit工具合并了多个预训练模型，具有较好的文本生成能力。

大型语言模型

360zhinao 7B Base

360智脑是由奇虎360开发的开源大语言模型系列，包含基础模型和多种上下文长度的对话模型，支持中文和英文。

大型语言模型

Transformers 支持多种语言

Strangemerges 53 7B Model Stock

StrangeMerges_53-7B-model_stock 是使用 LazyMergekit 合并多个7B参数规模模型的结果，具有强大的文本生成能力。

大型语言模型

Jambatypus V0.1

基于Jamba-v0.1在Open-Platypus-Chat数据集上通过QLoRA微调的大语言模型，支持对话任务

大型语言模型

Transformers 英语

基于Mistral架构的大语言模型，使用Pile数据集训练，支持英语文本处理

大型语言模型

Transformers 英语

Openhercules 2.5 Mistral 7B AWQ

OpenHercules-2.5-Mistral-7B 是一个基于 Mistral-7B 架构的融合模型，结合了 Hercules-2.5-Mistral-7B 和 OpenHermes-2.5-Mistral-7B 的优势，适用于文本生成和对话任务。

大型语言模型

Transformers 英语

Swallow MX 8x7b NVE V0.1

Swallow-MX-8x7b-NVE-v0.1是基于Mixtral-8x7B-Instruct-v0.1进行持续预训练的混合专家模型，主要增强了日语能力。

大型语言模型

Transformers 支持多种语言

Pasta-Lake-7b 是一个通过合并 Test157t/Pasta-PrimaMaid-7b 和 macadeliccc/WestLake-7B-v2-laser-truthy-dpo 两个模型而创建的7B参数规模的语言模型。

大型语言模型

Tinymistral 6x248M

TinyMistral-6x248M是通过LazyMergekit工具融合6个TinyMistral变体的混合专家系统，在nampdn-ai/mini-peS2o数据集上进行了预训练

大型语言模型

DareBeagle-7B是通过LazyMergekit合并mlabonne/NeuralBeagle14-7B和mlabonne/NeuralDaredevil-7B得到的7B参数大语言模型，在多个基准测试中表现优异。

大型语言模型

Velara 11B V2 GGUF

Velara 11B v2 是一个基于Mistral架构的大型语言模型，专注于文本生成任务，采用Alpaca-InstructOnly2提示模板。

大型语言模型英语

Norocetacean 20B 10k GGUF

Norocetacean 20B 10K 是一个基于 Llama 2 架构的大型语言模型，经过微调以支持中文任务。

大型语言模型

Openhermes 2 Mistral 7B

OpenHermes 2 Mistral 7B 是基于 Mistral-7B 微调的先进语言模型，主要使用 GPT-4 生成的合成数据进行训练，擅长对话和指令跟随任务。

大型语言模型

Transformers 英语

Sheared LLaMA 1.3B

Sheared-LLaMA-1.3B是基于LLaMA-2-7B通过结构化剪枝和持续预训练得到的高效语言模型

大型语言模型

精选推荐AI模型

Llama 3 Typhoon V1.5x 8b Instruct

专为泰语设计的80亿参数指令模型，性能媲美GPT-3.5-turbo，优化了应用场景、检索增强生成、受限生成和推理任务

大型语言模型

Transformers 支持多种语言

Cadet-Tiny是一个基于SODA数据集训练的超小型对话模型，专为边缘设备推理设计，体积仅为Cosmo-3B模型的2%左右。

Transformers 英语

Roberta Base Chinese Extractive Qa

基于RoBERTa架构的中文抽取式问答模型，适用于从给定文本中提取答案的任务。

问答系统中文

AIbase

智启未来，您的人工智能解决方案智库

简体中文

© 2025AIbase 备案号：闽ICP备08105208号-24