多任务文本生成

# 多任务文本生成

T5gemma S S Ul2

T5Gemma是谷歌推出的轻量级且强大的编码器-解码器研究模型家族，适用于多种生成和判别任务。

大型语言模型

Llama 3.1 8B SuperNova EtherealHermes GGUF

基于Llama-3.1架构的8B参数大语言模型，提供多种量化版本的GGUF格式文件

大型语言模型英语

Nvidia.llama 3 3 Nemotron Super 49B V1 GGUF

由NVIDIA开发的大型语言模型，基于Llama-3架构，拥有490亿参数，适用于多种文本生成任务。

大型语言模型

Llama 3.1 8b DodoWild V2.01

基于Llama 3.1架构的8B参数语言模型，通过mergekit合并多个模型而成，具备文本生成能力

大型语言模型

Llama 3.1 8b Dolermed V1.01

基于Llama 3.1架构的8B参数模型，通过mergekit合并多个预训练模型而成，具备文本生成能力。

大型语言模型

Qwen2.5 Dyanka 7B Preview

基于Qwen2.5架构的7B参数规模语言模型，通过TIES方法融合多个预训练模型而成

大型语言模型

Xiaojian9992024

Li 14b V0.4 Slerp0.1

这是一个使用SLERP方法合并的14B参数规模的大语言模型，由li-14b-v0.4和miscii-14b-0218两个基础模型合并而成。

大型语言模型

Deepseek R1 Distill Llama 3B

DeepSeek-R1-Distill-Llama-3B 是基于 Llama-3.2-3B 模型，使用 R1-Distill-SFT 数据集对 DeepSeek-R1 进行蒸馏得到的版本，具备文本生成能力。

大型语言模型

Transformers 英语

Thait5 Instruct

基于kobkrit/thai-t5-base微调的泰语指令模型，支持对话、问答、摘要等任务

大型语言模型

Transformers 其他

Phi 4 Model Stock V2

Phi-4-Model-Stock-v2是基于多个Phi-4变体模型合并而成的大语言模型，采用model_stock合并方法，在多个基准测试中表现良好。

大型语言模型

Dolphin3.0 Llama3.2 1B GGUF

基于Llama3.2架构的1B参数量化模型，支持文本生成任务，适用于多种量化版本选择

大型语言模型英语

Dolphin3.0 Llama3.1 8B GGUF

Dolphin3.0-Llama3.1-8B模型的量化版本，支持在资源受限环境下高效运行，提供多种量化类型选择。

大型语言模型英语

3blarenegv3 ECE PRYMMAL Martial

使用mergekit合并预训练语言模型得到的模型，在多个文本生成任务上有评估结果

大型语言模型

由日本国立信息学研究所开发的大语言模型，支持日语和英语，基于Transformer架构，参数量130亿

大型语言模型

Transformers 支持多种语言

Buddyglass V0.3 Xortron7MethedUpSwitchedUp

基于多个8B参数Llama-3.1模型的合并模型，采用model_stock方法优化性能

大型语言模型

Mistral NeMo Minitron 8B Base

Mistral-NeMo-Minitron-8B-Base是一个基础的文本生成模型，通过对Mistral-NeMo 12B进行剪枝和蒸馏得到，适用于多种自然语言生成任务。

大型语言模型

Gemma是Google推出的轻量级前沿开放模型系列，基于与Gemini相同技术构建，适用于多种文本生成任务。

大型语言模型

Llama 3 Instruct 8B SimPO SPPO Iter3 Merge

这是一个基于Meta Llama 3构建的合并预训练语言模型，结合了SimPO和SPPO-Iter3两个模型的优势，适用于文本生成任务。

大型语言模型

Gemma是Google推出的轻量级前沿开放模型系列，基于与Gemini相同技术构建，适用于多种文本生成任务。

大型语言模型

Gemma是Google推出的轻量级开源大语言模型系列，基于创建Gemini模型的相同技术构建，适用于多种文本生成任务。

大型语言模型

Orca Mini V5 8b Dpo

基于Llama 3架构的8B参数模型，使用多种DPO数据集训练，专注于文本生成任务

大型语言模型

Transformers 英语

UNA ThePitbull 21.4B V2

UNA-ThePitbull-21.4B-v2是一款基于21.4B参数的大型语言模型，性能接近70B模型，融合了情商与智商，擅长对话和文本生成。

大型语言模型

Llama4some SOVL 4x8B L3 V1

这是一个通过mergekit合并多个预训练语言模型得到的专家混合模型，旨在创造最不受约束的文本生成能力。

大型语言模型

Llama 3 Stinky V2 8B

这是一个基于Llama-3架构的8B参数模型，通过mergekit工具合并了多个预训练模型，具有较好的文本生成能力。

大型语言模型

Spyazweb AI DeepMind Project

基于Mixtral架构的多功能大语言模型，融合深度心智与自我优化能力，支持多语言文本生成与复杂推理任务

大型语言模型

Transformers 英语

基于Meta-Llama-3-8B优化的意大利语大语言模型，支持英语和意大利语文本生成任务

大型语言模型

Transformers 支持多种语言

Phi 3 Portuguese Tom Cat 4k Instruct

基于30万条葡萄牙语指令数据集训练的葡萄牙语模型，由microsoft/Phi-3-mini-4k微调而来

大型语言模型

Transformers 其他

基于Meta-Llama-3-8B-Instruct的增强版本，通过卡布拉30k数据集进行微调优化，特别针对葡萄牙语理解和应答进行了专项优化。

大型语言模型支持多种语言

Meta Llama 3 8B Instruct

Meta发布的80亿参数指令微调大语言模型，优化对话场景并在基准测试中超越多数开源聊天模型

大型语言模型

Transformers 英语

Orbita-v0.1是一个基于Qwen 14B的土耳其语大语言模型，在土耳其语的多个维度上具备多样化能力，涵盖编程、数学等多种任务。

大型语言模型

Transformers 其他

Neuralstar AlphaWriter 4x7b

NeuralStar_AlphaWriter_4x7b是一个基于混合专家技术(MoE)构建的7B参数语言模型，专为创意写作任务优化，融合了四个擅长不同写作领域的专家模型。

大型语言模型

mera-mix-4x7B是一个专家混合（MoE）模型，规模为Mixtral-8x7B的一半，但性能相当且推理速度更快。

大型语言模型

Recurrentgemma 2b It

RecurrentGemma是基于Google新型循环架构构建的开源语言模型，提供更高效的长序列处理能力

大型语言模型

Gemma 1.1 7b It

Gemma是谷歌推出的轻量级、最先进的开源模型系列，基于与Gemini模型相同的研究和技术构建。适用于多种文本生成任务，如问答、摘要和推理。

大型语言模型

Mistral Portuguese Luana 7b

基于Mistral-7B微调的葡萄牙语指令优化模型，使用20万条葡萄牙语指令训练，填补葡萄牙语模型空白

大型语言模型

Transformers 其他

Gemma Portuguese Luana 2b

这是一个基于Gemma架构的2B参数规模的葡萄牙语大语言模型，专门针对巴西葡萄牙语优化，支持指令跟随和文本生成任务。

大型语言模型

Transformers 其他

Mistral 7B Portuguese

基于Mistral-7B-Instruct-v0.2微调的葡萄牙语大语言模型，专注于提升葡萄牙语文本生成能力

大型语言模型

Transformers 支持多种语言

Zephyr 7b Gemma V0.1

Zephyr 7B Gemma是基于google/gemma-7b微调的语言模型，使用直接偏好优化(DPO)在公开合成数据集上训练，旨在作为有用的助手。

大型语言模型

Tito-7B-slerp是通过mergekit工具融合YugoGPT和AlphaMonarch-7B两个模型而成的大语言模型，在塞尔维亚语和英语任务上表现优异。

大型语言模型

Gemma是谷歌推出的轻量级开源大语言模型，基于与Gemini相同技术构建，适用于多种文本生成任务。

大型语言模型

精选推荐AI模型

Llama 3 Typhoon V1.5x 8b Instruct

专为泰语设计的80亿参数指令模型，性能媲美GPT-3.5-turbo，优化了应用场景、检索增强生成、受限生成和推理任务

大型语言模型

Transformers 支持多种语言

Cadet-Tiny是一个基于SODA数据集训练的超小型对话模型，专为边缘设备推理设计，体积仅为Cosmo-3B模型的2%左右。

Transformers 英语

Roberta Base Chinese Extractive Qa

基于RoBERTa架构的中文抽取式问答模型，适用于从给定文本中提取答案的任务。

问答系统中文

AIbase

智启未来，您的人工智能解决方案智库

简体中文

© 2025AIbase 备案号：闽ICP备08105208号-24