多任务泛化

# 多任务泛化

Acemath RL Nemotron 7B GGUF

AceMath-RL-Nemotron-7B 是一个完全通过强化学习训练的数学推理模型，基于 Deepseek-R1-Distilled-Qwen-7B 进行训练，在数学推理任务中表现出色，同时在编码任务上也有一定的泛化能力。

大型语言模型

Transformers 英语

Gemma 3 12B FornaxV.2 QAT CoT Q4 0 GGUF

这是一个实验性的小型思维模型，旨在8GiB消费级显卡上运行，具备通用推理能力。通过监督微调（SFT）和高质量推理轨迹训练，模型能够将推理能力泛化至多种任务。

大型语言模型

GLM 4 9B 0414 GGUF

GLM-4-9B-0414是GLM家族中的轻量级成员，拥有90亿参数，在数学推理和通用任务上表现出色，为资源受限场景提供了高效的解决方案。

大型语言模型支持多种语言

T0++是基于T5架构的自然语言处理模型，通过多任务提示训练实现零样本任务泛化能力，在多种NLP任务上超越GPT-3且体积更小。

大型语言模型

Transformers 英语

Llama 3.1 MIG Tulu 3 8B SFT

基于自动筛选的5万条Tulu-3-MIG数据集进行微调的Llama-3.1-8B模型

大型语言模型

Spatialvla 4b 224 Sft Bridge

该模型是基于SpatialVLA模型在bridge数据集上微调得到的视觉-语言-动作模型，专为Simpler-env基准测试打造。

文本生成图像

Transformers 英语

Llama 3.1 8b Medusa V1.01

基于Llama 3.1架构的8B参数语言模型，通过mergekit合并多个专业模型而成，在文本生成任务中表现优异。

大型语言模型

Llama3.1 Gutenberg Doppel 70B

基于Hermes-3-Llama-3.1-70B-lorablated模型，在Gutenberg数据集上进行微调的大语言模型

大型语言模型

LWM是首个无线通信领域的基础模型，作为通用特征提取器开发，能够从无线信道数据中提取精细表征。

物理学模型

Robustsam Vit Large

RobustSAM是一种在退化图像上稳健分割任意对象的模型，基于SAM改进，提升了在低质量图像上的分割性能。

Transformers 其他

Llama 3 Gutenberg 8B

基于Llama-3-8b的微调模型，使用Gutenberg DPO数据集进行优化，适用于文本生成任务。

大型语言模型

Percival 01 7b Slerp

Percival_01-7b-slerp 是一个在 OPENLLM 排行榜上排名第二的 7B 参数规模的大语言模型，通过 LazyMergekit 工具合并 liminerity/M7-7b 和 Gille/StrangeMerges_32-7B-slerp 两个模型得到。

大型语言模型

Roberta Large Zeroshot V2.0 C

专为高效零样本分类设计的RoBERTa-large模型，使用商业友好数据训练，无需训练数据即可执行文本分类任务。

Transformers 英语

Locutusquexfelladrin TinyMistral248M Instruct

这是一个通过合并Locutusque/TinyMistral-248M-Instruct和Felladrin/TinyMistral-248M-SFT-v4并使用mergekit工具创建的模型，融合了两者的优势，具有编程能力和推理技巧，同时保持低幻觉和良好的指令遵循能力。

大型语言模型

Transformers 英语

这是一个基于Llama-2-13B的混合模型，结合了Tiefighter、MedLLaMA和limarp-v2等多个模型的特点，适用于多种文本生成任务。

大型语言模型

Wizardlm 13B V1.2

WizardLM-13B V1.2是基于Llama-2 13b训练的大型语言模型，专注于复杂指令遵循能力。

大型语言模型

Hh Rlhf Rm Open Llama 3b

基于LMFlow框架训练的奖励模型，针对HH - RLHF数据集（仅有用部分），以open_llama_3b为基础模型进行训练，具有良好的泛化能力。

大型语言模型

精选推荐AI模型

Llama 3 Typhoon V1.5x 8b Instruct

专为泰语设计的80亿参数指令模型，性能媲美GPT-3.5-turbo，优化了应用场景、检索增强生成、受限生成和推理任务

大型语言模型

Transformers 支持多种语言

Cadet-Tiny是一个基于SODA数据集训练的超小型对话模型，专为边缘设备推理设计，体积仅为Cosmo-3B模型的2%左右。

Transformers 英语

Roberta Base Chinese Extractive Qa

基于RoBERTa架构的中文抽取式问答模型，适用于从给定文本中提取答案的任务。

问答系统中文

AIbase

智启未来，您的人工智能解决方案智库

简体中文

© 2025AIbase 备案号：闽ICP备08105208号-24