参数高效

# 参数高效

Qwen2.5 Medical Lora

基于Qwen2.5-3B-Instruct模型在医疗健康数据集上微调的版本，旨在生成与医疗相关的响应，为用户提供健康指导。

大型语言模型

Transformers 英语

AbdullahAlnemr1

ACIP项目提供的Qwen2.5-7B可压缩版本，支持动态调整压缩率并保持模型性能

大型语言模型

Transformers 英语

MerantixMomentum

ACIP项目提供的可压缩版本Llama-7B模型，支持动态调整压缩率

大型语言模型

Transformers 英语

MerantixMomentum

该模型是基于TRL（Transformer Reinforcement Learning）库优化的高效微调模型，专注于强化学习在Transformer模型中的应用。

大型语言模型

TextNet是一款专为文本检测设计的轻量高效架构，通过三个变体在检测精度与推理速度间实现卓越平衡。

Chat Summarization

这是一个基于T5-base架构，使用LoRA技术微调的对话摘要模型，专为高效生成对话摘要而设计。

文本生成英语

TimeMoE是一个基于专家混合(MoE)架构的十亿级时间序列基础模型，专注于时间序列预测任务。

Blockchainlabs 7B Merged Test2 4 Prune Sft 4bit DPO Orca

这是一个经过剪枝和DPO训练的7B参数规模的小型LLM，专为设备端用途优化

大型语言模型

Transformers 英语

Chinese Electra Large Generator

中文ELECTRA是由哈工大-讯飞联合实验室基于谷歌ELECTRA模型开发的中文预训练模型，具有参数量小但性能优越的特点。

大型语言模型

Transformers 中文

精选推荐AI模型

Llama 3 Typhoon V1.5x 8b Instruct

专为泰语设计的80亿参数指令模型，性能媲美GPT-3.5-turbo，优化了应用场景、检索增强生成、受限生成和推理任务

大型语言模型

Transformers 支持多种语言

Cadet-Tiny是一个基于SODA数据集训练的超小型对话模型，专为边缘设备推理设计，体积仅为Cosmo-3B模型的2%左右。

Transformers 英语

Roberta Base Chinese Extractive Qa

基于RoBERTa架构的中文抽取式问答模型，适用于从给定文本中提取答案的任务。

问答系统中文

AIbase

智启未来，您的人工智能解决方案智库

简体中文

© 2025AIbase 备案号：闽ICP备08105208号-24