小样本训练
Kinyawhisper
MIT
KinyaWhisper是基于OpenAI Whisper模型微调的卢旺达语自动语音识别(ASR)系统,专为低资源土著语言设计。
语音识别
Transformers
其他
K
benax-rw
149
3
Tinyllava Video Coldstart NextQA 16
Apache-2.0
TinyLLaVA-Video-R1 是一个视频文本到文本模型,通过使用来自NextQA数据集的16个手动标注样本对TinyLLaVA-Video进行冷启动训练获得。
视频生成文本
Transformers
T
Zhang199
63
0
Dit Wikiart Large
MIT
基于Wikiart数据集训练的扩散变换器模型,用于生成艺术作品图像
图像生成
D
kaupane
35
0
R1 Aqa
Apache-2.0
R1-AQA是基于Qwen2-Audio-7B-Instruct的音频问答模型,通过群体相对策略优化(GRPO)算法进行强化学习优化,在MMAU基准测试中取得最先进性能。
音频生成文本
Transformers
R
mispeech
791
14
Tinycode Python
MIT
该模型基于bigcode/starcoderdata数据集中的58个Python文件中的4个进行训练,主要用于代码相关任务。
大型语言模型
Transformers
支持多种语言
T
blueapple8259
22
1
Donut Finetune Rvl Cdip
Apache-2.0
基于Donut框架的文档分类模型,在RVL-CDIP小规模数据集上训练
图像生成文本
Transformers
英语
D
sitloboi2012
18
0
Fruits And Vegetables Detector 36
Apache-2.0
基于ResNet-50微调的果蔬图像分类模型,可识别36种常见水果和蔬菜
图像分类
Transformers
英语
F
jazzmacedo
247
2
Sd Controlnet Depth
Openrail
ControlNet是一种通过深度估计条件控制Stable Diffusion的神经网络结构,可生成符合深度约束的图像。
图像生成
其他
S
lllyasviel
11.41k
55
Beit Base Patch16 224 Pt22k Ft22k Finetuned FER2013 7e 05 Finetuned SFEW 7e 05
Apache-2.0
基于BEiT架构的图像分类模型,在FER2013数据集上微调,用于面部表情识别
图像分类
Transformers
B
lixiqi
18
0
Sd Class Wikiart From Bedrooms
MIT
这是一个基于Google的DDPM卧室图像模型初始化,并在WikiArt数据集上微调的扩散模型,用于无条件图像生成。
图像生成
S
johnowhitaker
278
0
Resnet 18 Feature Extraction
Apache-2.0
基于microsoft/resnet-18微调的图像分类模型,在图像文件夹数据集上表现优异。
图像分类
Transformers
R
SiddharthaM
28
0
Vit Base Mnist
Apache-2.0
基于ViT架构在MNIST数据集上微调的图像分类模型,准确率达99.49%
图像分类
Transformers
V
farleyknight-org-username
1,770
8
Ft Pt Br Local
Apache-2.0
基于jonatasgrosman/wav2vec2-large-xlsr-53-portuguese微调的葡萄牙语自动语音识别模型
语音识别
Transformers
F
tonyalves
31
1
Summarizer Cnndm
基于BART模型微调的英文文本摘要生成器,在cnn-dailymail数据集上训练
文本生成
Transformers
英语
S
yuvraj
18
0
Persian T5 Paraphraser
这是一个针对波斯语的文本复述模型,基于波斯语单语T5模型构建,能够生成波斯语文本的多种复述版本。
文本生成
Transformers
其他
P
erfan226
290
2
Deit FaceMask Finetuned
Apache-2.0
基于Face-Mask18K数据集训练的蒸馏式视觉Transformer模型,用于高效口罩检测
图像分类
Transformers
D
AkshatSurolia
27
0