多任务推理

# 多任务推理

Moonshotai.kimi K2 Instruct BF16

Kimi K2 是一款先进的混合专家（MoE）语言模型，拥有 320 亿激活参数和 1 万亿总参数，针对代理能力进行了优化。

大型语言模型

Midm 2.0 Base Instruct Gguf

Mi:dm 2.0 是采用 KT 专有技术开发的'以韩国为中心的 AI'模型，深度内化了韩国社会独特的价值观、认知框架和常识推理。

大型语言模型

Transformers 支持多种语言

Midm 2.0 Mini Instruct Gguf

Mi:dm 2.0 是一款以韩国为中心的 AI 模型，由 KT 运用其专有技术开发。该模型深入内化了韩国社会独特的价值观、认知框架和常识推理，不仅能处理和生成韩语内容，还能体现对韩国社会文化规范和价值观的深刻理解。

大型语言模型

Transformers 支持多种语言

Marin 8b Instruct

Marin 8B是一个开源的8B参数规模的大型语言模型，基于Llama架构开发，支持英语文本生成任务。

大型语言模型英语

marin-community

Llama 3.1 8B AthenaSky MegaMix

通过MergeKit融合多个高质量模型的8B参数大语言模型，优化了推理、对话和创意生成能力

大型语言模型

Transformers 英语

Guardreasoner 1B

GuardReasoner 1B是基于meta-llama/Llama-3.2-1B通过R-SFT和HS-DPO微调的版本，专注于分析人类与AI交互的分类任务。

大型语言模型

Transformers 英语

Guardreasoner 3B

基于Llama-3.2-3B通过R-SFT和HS-DPO方法微调的安全防护模型，用于分析人机交互中的有害内容

大型语言模型

Guardreasoner 8B

GuardReasoner 8B是基于meta-llama/Llama-3.1-8B微调的模型，专注于推理式LLM安全防护

大型语言模型

Hunyuan 7B Instruct

混元-7B-Instruct是腾讯发布的中英文双语大语言模型，具备强大的文本生成和理解能力，是目前最强的中文7B Dense模型之一。

大型语言模型

Transformers 英语

Deepseek R1 Bf16

DeepSeek-R1是第一代推理模型，在数学、代码和推理任务上表现出色，性能可与OpenAI-o1相媲美。

大型语言模型

opensourcerelease

Gemma是Google推出的轻量级开源大语言模型，基于与Gemini相同技术构建，适用于文本生成任务。

大型语言模型

Llama3 German 8B 32k

基于Meta Llama3-8B优化的德语大语言模型，通过650亿德语语料持续预训练，专为德语优化并支持32k长上下文

大型语言模型

Transformers 德语

Calme 2.3 Llama3 70b

基于Meta-Llama-3-70B-Instruct模型通过DPO微调的大语言模型，在多项基准测试中表现优异

大型语言模型

Transformers 英语

Rhea-72b-v0.5是基于Smaug-72B-v0.1微调的大语言模型，在HuggingFace开放大模型排行榜上排名第一。

大型语言模型

Transformers 英语

Openhercules 2.5 Mistral 7B AWQ

OpenHercules-2.5-Mistral-7B 是一个基于 Mistral-7B 架构的融合模型，结合了 Hercules-2.5-Mistral-7B 和 OpenHermes-2.5-Mistral-7B 的优势，适用于文本生成和对话任务。

大型语言模型

Transformers 英语

Gemma 7b Zephyr Sft

基于Google Gemma 7B模型，采用Zephyr SFT配方微调的大语言模型，主要用于文本生成任务

大型语言模型

Ghost 7b V0.9.1

Ghost 7B是一个专注于优化推理和多任务知识的大型语言模型，支持英文和越南文，基于Mistral 7B架构。

大型语言模型

Transformers 支持多种语言

Orthogonal 2x7B V2 Base

orthogonal-2x7B-v2-base 是一个基于 Mistral-7B-Instruct-v0.2 和 SanjiWatsuki/Kunoichi-DPO-v2-7B 的混合专家模型，专注于文本生成任务。

大型语言模型

DareBeagle-7B是通过LazyMergekit合并mlabonne/NeuralBeagle14-7B和mlabonne/NeuralDaredevil-7B得到的7B参数大语言模型，在多个基准测试中表现优异。

大型语言模型

Tiny Llava V1 Hf

TinyLLaVA是一个小型大规模多模态模型框架，专注于视觉语言任务，参数规模小但性能优异。

图像生成文本

Transformers 支持多种语言

Galactica 6.7B EssayWriter

基于Galactica架构的67亿参数大语言模型，专注于文章写作任务，在开放大语言模型排行榜中平均得分37.75。

大型语言模型

KnutJaegersberg

Openorca Platypus2 13B

OpenOrca-Platypus2-13B是Platypus2-13B与OpenOrcaxOpenChat-Preview2-13B的融合模型，结合了STEM/逻辑数据集和GPT-4精炼数据集的优势

大型语言模型

Transformers 英语

Polyglot Ko 12.8b

Polyglot-Ko-12.8B是由EleutherAI多语言团队开发的大规模韩语自回归语言模型，具有12.8亿参数，专门针对韩语优化。

大型语言模型

Transformers 韩语

精选推荐AI模型

Llama 3 Typhoon V1.5x 8b Instruct

专为泰语设计的80亿参数指令模型，性能媲美GPT-3.5-turbo，优化了应用场景、检索增强生成、受限生成和推理任务

大型语言模型

Transformers 支持多种语言

Cadet-Tiny是一个基于SODA数据集训练的超小型对话模型，专为边缘设备推理设计，体积仅为Cosmo-3B模型的2%左右。

Transformers 英语

Roberta Base Chinese Extractive Qa

基于RoBERTa架构的中文抽取式问答模型，适用于从给定文本中提取答案的任务。

问答系统中文

AIbase

智启未来，您的人工智能解决方案智库

简体中文

© 2025AIbase 备案号：闽ICP备08105208号-24