低资源高效训练
Mamba Nli Ensemble
基于Mamba状态空间模型在COMP34812数据集上微调的二元自然语言推理分类器
文本分类
支持多种语言
M
patrickmlml
15
1
Colqwen2.5 3b Multilingual V1.0
MIT
基于Qwen2.5-VL-3B-Instruct并采用ColBERT策略的多语言视觉检索器,在Vidore基准测试中表现优异
文本生成图像
支持多种语言
C
Metric-AI
2,475
7
Llama Bodo Translation Model
Apache-2.0
基于Meta-Llama-3.1-8B的4位量化版本微调的博多语-英语双向翻译模型,使用Unsloth优化训练速度
大型语言模型
Transformers
支持多种语言
L
Luson045
27
1
Colqwen2.5 3b Multilingual
MIT
基于Qwen2.5-VL-3B-Instruct的多语言视觉检索器,采用ColBERT策略,在Vidore基准测试中表现优异
文本生成图像
支持多种语言
C
Metric-AI
1,957
14
Colsmol 500M
MIT
基于SmolVLM-Instruct-500M与ColBERT策略的视觉检索模型,能高效通过视觉特征索引文档
文本生成图像
英语
C
vidore
1,807
17
Paligemma Derm
Apache-2.0
基于PaliGemma-3B架构的视觉-语言模型,专门针对皮肤病图像分析任务进行微调,可辅助识别各种皮肤状况。
图像生成文本
Transformers
英语
P
brucewayne0459
178
2
Suzume Llama 3 8B Japanese
其他
基于Llama 3的日语微调模型,专为日语对话优化
大型语言模型
Transformers
S
lightblue
2,011
24
Turkish Gpt2 Large 750m Instruct V0.1
MIT
基于ytu-ce-cosmos/turkish-gpt2-large开发的土耳其语指令微调语言模型,通过3.5万条指令数据集微调
大型语言模型
Transformers
其他
T
ytu-ce-cosmos
2,980
40
Airavata
Airavata是基于7B参数的OpenHathi模型在IndicInstruct数据集上微调而成的多语言大语言模型,支持英语和印地语。
大型语言模型
支持多种语言
A
ai4bharat
992
34
Gpt2 Finetuned Cnn Summarization V1
MIT
基于GPT-2微调的文本摘要生成模型
文本生成
Transformers
G
gavin124
24
1
Distilbert Base Squad2 Custom Dataset
基于Distilbert_Base微调的SQuAD2.0及自定义问答数据集模型,专注于高效问答任务
问答系统
Transformers
D
superspray
17
0
Distilroberta Base Testingsb Testingsb
Apache-2.0
该模型是基于distilroberta-base在未知数据集上微调的版本,主要用于文本处理任务。
大型语言模型
Transformers
D
MistahCase
30
0