英语文本生成

# 英语文本生成

Gemma3 27b Abliterated Dpo

基于mlabonne/gemma-3-27b-it-abliterated微调的大语言模型，采用Unsloth加速框架和Huggingface的TRL库进行训练，效率提升2倍。

大型语言模型

Transformers 英语

Ice0.101 20.03 RP GRPO 1

基于Unsloth无惰性优化框架和Huggingface TRL训练库优化的薄雾模型，实现2倍速训练效率

大型语言模型

Transformers 英语

基于Unsloth和Huggingface TRL库优化的Qwen2模型，推理速度提升2倍

大型语言模型

Transformers 英语

RWKV7 Goose Pile 168M HF

采用闪存线性注意力格式的RWKV-7模型，基于Pile数据集训练，支持英语文本生成任务。

大型语言模型

Transformers 英语

RWKV7 Goose World3 1.5B HF

采用闪存线性注意力（flash-linear attention）格式的RWKV-7模型，支持英语文本生成任务。

大型语言模型

Safetensors 英语

Doge是一个采用动态掩码注意力机制进行序列转换的模型，可使用多层感知器或跨域专家混合进行状态转换。

大型语言模型

Transformers 支持多种语言

Stella En 1.5B V5 GGUF

Stella_en_1.5B_v5 是一个基于英语的文本生成模型，参数规模为15亿，适用于句子相似度等任务。

大型语言模型英语

Gemma 2 9B It SPPO Iter3

基于自博弈偏好优化方法在第三轮迭代中开发的89亿参数语言模型，以google/gemma-2-9b-it为起点，使用UltraFeedback数据集进行微调

大型语言模型

Transformers 英语

Gemma是Google推出的轻量级开放大语言模型系列，基于创建Gemini模型的相同技术构建，适用于多种文本生成任务。

大型语言模型

Mythomax L2 13b Q4 K M GGUF

MythoMax L2 13b是一个基于Q4_K_M量化版本的大语言模型，适用于文本生成任务。

大型语言模型英语

Meta Llama Meta Llama 3 8B Instruct 4bits

Meta Llama 3 8B参数版本的指令调优模型，针对对话场景优化，具有优秀的帮助性和安全性表现。

大型语言模型

Llama 3 NeuralPaca 8b

基于Meta LLAMA-3-8B构建的优化模型，采用无惰优化技术和Huggingface TRL库训练，速度提升2倍

大型语言模型

Transformers 英语

K2是一个650亿参数规模的大语言模型，通过完全透明化的训练方案，以35%计算量优势超越Llama 2 70B。

大型语言模型

Transformers 英语

Zephyr Orpo 141b A35b V0.1 GGUF

基于Mixtral-8x22B-v0.1微调的1410亿参数混合专家模型(MoE)，激活参数350亿，主要用于英语文本生成任务

大型语言模型英语

Recurrentgemma 2b

RecurrentGemma是Google基于新型循环架构开发的开放语言模型家族，提供预训练和指令调优版本，适用于多种文本生成任务。

大型语言模型

MicroLlama是一个由个人开发者keeeeenw在500美元预算内预训练的3亿参数Llama模型，专注于英语文本生成任务。

大型语言模型

Transformers 英语

Gemma 1.1 2b It

Gemma是Google推出的轻量级开放模型系列，基于与Gemini相同技术构建，适用于多种文本生成任务。

大型语言模型

Gemma 1.1 7b It

Gemma是Google推出的轻量级开放模型系列，基于与Gemini相同技术构建，适用于文本生成任务。

大型语言模型

Mixtral Chat 7b

这是一个通过mergekit工具合并多个Mistral-7B变体模型而成的混合模型，专注于文本生成任务。

大型语言模型英语

Ministral 4b Instruct

Ministral是一个基于40亿参数的类GPT模型，采用与Mistral模型相同的架构，但规模更小，主要用于英语文本生成任务。

大型语言模型

Transformers 英语

Ministral 3b Instruct

Ministral是一个基于Mistral架构的小型语言模型系列，参数规模为30亿，主要用于英语文本生成任务。

大型语言模型

Transformers 英语

Gemma 7b Zephyr Sft

基于Google Gemma 7B模型，采用Zephyr SFT配方微调的大语言模型，主要用于文本生成任务

大型语言模型

无畏女仆-13B是一个更聪明、更擅长遵循指令的Noromaid版本，通过融合多个优秀模型的特点打造而成。

大型语言模型

Transformers 英语

Tinyllama 1.1B Chat V0.4 GGUF

TinyLlama-1.1B是一个紧凑型大语言模型，参数规模为11亿，基于Llama 2架构，专为计算和内存受限场景优化。

大型语言模型英语

Tinymistral 248M

基于Mistral 7B模型缩减至2.48亿参数的语言模型，专为文本生成任务设计，适用于下游任务微调。

大型语言模型

Transformers 英语

Mistral 7b Guanaco

基于Llama2架构的预训练语言模型，适用于英语文本生成任务

大型语言模型

Transformers 英语

Tinyllama 42M Fp32

这是一个基于TinyStories数据集训练的42M参数Llama 2架构float32精度模型，适用于简单的文本生成任务。

大型语言模型

Instruct Llama70B Dolly15k

基于Llama-2-70B微调的指令跟随模型，使用Dolly15k数据集训练，适用于英语文本生成任务。

大型语言模型

Transformers 英语

Pile-T5 Large 是基于 T5x 库在 The Pile 数据集上训练的编码器-解码器模型，主要用于英语文本到文本生成任务。

大型语言模型

Transformers 英语

Llama 2是由Meta开发的70亿参数规模预训练生成文本模型，属于开源大语言模型系列

大型语言模型

Transformers 英语

Llama 2是由Meta开发的开源大语言模型系列，包含70亿至700亿参数规模，支持英文文本生成任务。

大型语言模型

Transformers 英语

Redpajama INCITE 7B Instruct

RedPajama-INCITE-7B-Instruct 是一个由 Together 和开源 AI 社区领导者共同开发的 69 亿参数语言模型，针对少样本应用进行了微调。

大型语言模型

Transformers 英语

togethercomputer

Cerebras GPT 2.7B

Cerebras-GPT 2.7B 是基于 Transformer 架构的语言模型，旨在助力大语言模型的研究，可作为自然语言处理等领域的基础模型。

大型语言模型

Transformers 英语

Cerebras GPT 590M

Cerebras-GPT 590M是基于Transformer架构的语言模型，属于Cerebras-GPT模型家族，旨在研究大语言模型扩展规律并展示在Cerebras软硬件栈上训练大语言模型的简便性和可扩展性。

大型语言模型

Transformers 英语

Cerebras GPT 111M

Cerebras-GPT系列中的111M参数模型，采用GPT-3风格架构，使用The Pile数据集训练，遵循Chinchilla扩展定律实现计算最优。

大型语言模型

Transformers 英语

Pythia-1B是EleutherAI开发的可解释性研究专用语言模型，属于Pythia套件中的10亿参数规模版本，基于The Pile数据集训练。

大型语言模型

Transformers 英语

Pythia-12B是EleutherAI开发的可扩展语言模型套件中的最大模型，拥有120亿参数，专为促进大语言模型科学研究而设计

大型语言模型

Transformers 英语

Comet Atomic En

基于T5架构的英文事件推理模型，用于分析事件的前提条件、影响、意图和反应

大型语言模型

Transformers 英语

Pythia-6.9B是EleutherAI开发的大规模语言模型，属于Pythia可扩展套件的一部分，专为促进可解释性研究而设计。

大型语言模型

Transformers 英语

Pythia 1b Deduped

Pythia-10亿去重版是EleutherAI开发的可解释性研究专用语言模型，基于去重Pile数据集训练，采用Transformer架构，参数规模10亿

大型语言模型

Transformers 英语

精选推荐AI模型

Llama 3 Typhoon V1.5x 8b Instruct

专为泰语设计的80亿参数指令模型，性能媲美GPT-3.5-turbo，优化了应用场景、检索增强生成、受限生成和推理任务

大型语言模型

Transformers 支持多种语言

Cadet-Tiny是一个基于SODA数据集训练的超小型对话模型，专为边缘设备推理设计，体积仅为Cosmo-3B模型的2%左右。

Transformers 英语

Roberta Base Chinese Extractive Qa

基于RoBERTa架构的中文抽取式问答模型，适用于从给定文本中提取答案的任务。

问答系统中文

AIbase

智启未来，您的人工智能解决方案智库

简体中文

© 2025AIbase 备案号：闽ICP备08105208号-24