参数高效
Qwen2.5 Medical Lora
Apache-2.0
基于Qwen2.5-3B-Instruct模型在医疗健康数据集上微调的版本,旨在生成与医疗相关的响应,为用户提供健康指导。
大型语言模型
Transformers
英语
Q
AbdullahAlnemr1
58
1
Acip Qwen25 7b
Apache-2.0
ACIP项目提供的Qwen2.5-7B可压缩版本,支持动态调整压缩率并保持模型性能
大型语言模型
Transformers
英语
A
MerantixMomentum
80
2
Acip Llama1 7b
其他
ACIP项目提供的可压缩版本Llama-7B模型,支持动态调整压缩率
大型语言模型
Transformers
英语
A
MerantixMomentum
83
1
Nova 0.5 E1 7B
该模型是基于TRL(Transformer Reinforcement Learning)库优化的高效微调模型,专注于强化学习在Transformer模型中的应用。
大型语言模型
Transformers
N
oscar128372
46
2
Textnet Base
TextNet是一款专为文本检测设计的轻量高效架构,通过三个变体在检测精度与推理速度间实现卓越平衡。
文字识别
Transformers
T
czczup
1,061
3
Chat Summarization
Apache-2.0
这是一个基于T5-base架构,使用LoRA技术微调的对话摘要模型,专为高效生成对话摘要而设计。
文本生成
英语
C
dnzblgn
15
0
Timemoe 50M
Apache-2.0
TimeMoE是一个基于专家混合(MoE)架构的十亿级时间序列基础模型,专注于时间序列预测任务。
材料科学
T
Maple728
22.02k
13
Blockchainlabs 7B Merged Test2 4 Prune Sft 4bit DPO Orca
这是一个经过剪枝和DPO训练的7B参数规模的小型LLM,专为设备端用途优化
大型语言模型
Transformers
英语
B
alnrg2arg
18
2
Chinese Electra Large Generator
Apache-2.0
中文ELECTRA是由哈工大-讯飞联合实验室基于谷歌ELECTRA模型开发的中文预训练模型,具有参数量小但性能优越的特点。
大型语言模型
Transformers
中文
C
hfl
14
0