Kinyawhisper
MIT
KinyaWhisper是基于OpenAI Whisper模型微调的卢旺达语自动语音识别(ASR)系统,专为低资源土著语言设计。
语音识别
Transformers

其他
K
benax-rw
149
3
Tinyllava Video Coldstart NextQA 16
Apache-2.0
TinyLLaVA-Video-R1 是一个视频文本到文本模型,通过使用来自NextQA数据集的16个手动标注样本对TinyLLaVA-Video进行冷启动训练获得。
视频生成文本
Transformers

T
Zhang199
63
0
Dit Wikiart Large
MIT
基于Wikiart数据集训练的扩散变换器模型,用于生成艺术作品图像
图像生成
D
kaupane
35
0
R1 Aqa
Apache-2.0
R1-AQA是基于Qwen2-Audio-7B-Instruct的音频问答模型,通过群体相对策略优化(GRPO)算法进行强化学习优化,在MMAU基准测试中取得最先进性能。
音频生成文本
Transformers

R
mispeech
791
14
Tinycode Python
MIT
该模型基于bigcode/starcoderdata数据集中的58个Python文件中的4个进行训练,主要用于代码相关任务。
大型语言模型
Transformers

支持多种语言
T
blueapple8259
22
1
Donut Finetune Rvl Cdip
Apache-2.0
基于Donut框架的文档分类模型,在RVL-CDIP小规模数据集上训练
图像生成文本
Transformers

英语
D
sitloboi2012
18
0
Fruits And Vegetables Detector 36
Apache-2.0
基于ResNet-50微调的果蔬图像分类模型,可识别36种常见水果和蔬菜
图像分类
Transformers

英语
F
jazzmacedo
247
2
Sd Controlnet Depth
Openrail
ControlNet是一种通过深度估计条件控制Stable Diffusion的神经网络结构,可生成符合深度约束的图像。
图像生成
其他
S
lllyasviel
11.41k
55
Beit Base Patch16 224 Pt22k Ft22k Finetuned FER2013 7e 05 Finetuned SFEW 7e 05
Apache-2.0
基于BEiT架构的图像分类模型,在FER2013数据集上微调,用于面部表情识别
图像分类
Transformers

B
lixiqi
18
0
Sd Class Wikiart From Bedrooms
MIT
这是一个基于Google的DDPM卧室图像模型初始化,并在WikiArt数据集上微调的扩散模型,用于无条件图像生成。
图像生成
S
johnowhitaker
278
0
Resnet 18 Feature Extraction
Apache-2.0
基于microsoft/resnet-18微调的图像分类模型,在图像文件夹数据集上表现优异。
图像分类
Transformers

R
SiddharthaM
28
0
Vit Base Mnist
Apache-2.0
基于ViT架构在MNIST数据集上微调的图像分类模型,准确率达99.49%
图像分类
Transformers

V
farleyknight-org-username
1,770
8
Ft Pt Br Local
Apache-2.0
基于jonatasgrosman/wav2vec2-large-xlsr-53-portuguese微调的葡萄牙语自动语音识别模型
语音识别
Transformers

F
tonyalves
31
1
Summarizer Cnndm
基于BART模型微调的英文文本摘要生成器,在cnn-dailymail数据集上训练
文本生成
Transformers

英语
S
yuvraj
18
0
Persian T5 Paraphraser
这是一个针对波斯语的文本复述模型,基于波斯语单语T5模型构建,能够生成波斯语文本的多种复述版本。
文本生成
Transformers

其他
P
erfan226
290
2
Deit FaceMask Finetuned
Apache-2.0
基于Face-Mask18K数据集训练的蒸馏式视觉Transformer模型,用于高效口罩检测
图像分类
Transformers

D
AkshatSurolia
27
0
精选推荐AI模型
Llama 3 Typhoon V1.5x 8b Instruct
专为泰语设计的80亿参数指令模型,性能媲美GPT-3.5-turbo,优化了应用场景、检索增强生成、受限生成和推理任务
大型语言模型
Transformers

支持多种语言
L
scb10x
3,269
16
Cadet Tiny
Openrail
Cadet-Tiny是一个基于SODA数据集训练的超小型对话模型,专为边缘设备推理设计,体积仅为Cosmo-3B模型的2%左右。
对话系统
Transformers

英语
C
ToddGoldfarb
2,691
6
Roberta Base Chinese Extractive Qa
基于RoBERTa架构的中文抽取式问答模型,适用于从给定文本中提取答案的任务。
问答系统
中文
R
uer
2,694
98
AIbase是一个专注于MCP服务的平台,为AI开发者提供高质量的模型上下文协议服务,助力AI应用开发。
简体中文