小样本训练

# 小样本训练

KinyaWhisper是基于OpenAI Whisper模型微调的卢旺达语自动语音识别(ASR)系统，专为低资源土著语言设计。

Transformers 其他

Tinyllava Video Coldstart NextQA 16

TinyLLaVA-Video-R1 是一个视频文本到文本模型，通过使用来自NextQA数据集的16个手动标注样本对TinyLLaVA-Video进行冷启动训练获得。

视频生成文本

Dit Wikiart Large

基于Wikiart数据集训练的扩散变换器模型，用于生成艺术作品图像

R1-AQA是基于Qwen2-Audio-7B-Instruct的音频问答模型，通过群体相对策略优化（GRPO）算法进行强化学习优化，在MMAU基准测试中取得最先进性能。

音频生成文本

Flux Madison Beer

基于25张麦迪逊·比尔图片训练的LoRA模型，无需触发词即可生成相关风格图像

Tinycode Python

该模型基于bigcode/starcoderdata数据集中的58个Python文件中的4个进行训练，主要用于代码相关任务。

大型语言模型

Transformers 支持多种语言

Donut Finetune Rvl Cdip

基于Donut框架的文档分类模型，在RVL-CDIP小规模数据集上训练

图像生成文本

Transformers 英语

Fruits And Vegetables Detector 36

基于ResNet-50微调的果蔬图像分类模型，可识别36种常见水果和蔬菜

Transformers 英语

Sd Controlnet Depth

ControlNet是一种通过深度估计条件控制Stable Diffusion的神经网络结构，可生成符合深度约束的图像。

图像生成其他

Beit Base Patch16 224 Pt22k Ft22k Finetuned FER2013 7e 05 Finetuned SFEW 7e 05

基于BEiT架构的图像分类模型，在FER2013数据集上微调，用于面部表情识别

Sd Class Wikiart From Bedrooms

这是一个基于Google的DDPM卧室图像模型初始化，并在WikiArt数据集上微调的扩散模型，用于无条件图像生成。

Resnet 18 Feature Extraction

基于microsoft/resnet-18微调的图像分类模型，在图像文件夹数据集上表现优异。

基于ViT架构在MNIST数据集上微调的图像分类模型，准确率达99.49%

farleyknight-org-username

基于jonatasgrosman/wav2vec2-large-xlsr-53-portuguese微调的葡萄牙语自动语音识别模型

Summarizer Cnndm

基于BART模型微调的英文文本摘要生成器，在cnn-dailymail数据集上训练

Transformers 英语

Persian T5 Paraphraser

这是一个针对波斯语的文本复述模型，基于波斯语单语T5模型构建，能够生成波斯语文本的多种复述版本。

Transformers 其他

Deit FaceMask Finetuned

基于Face-Mask18K数据集训练的蒸馏式视觉Transformer模型，用于高效口罩检测

精选推荐AI模型

Llama 3 Typhoon V1.5x 8b Instruct

专为泰语设计的80亿参数指令模型，性能媲美GPT-3.5-turbo，优化了应用场景、检索增强生成、受限生成和推理任务

大型语言模型

Transformers 支持多种语言

Cadet-Tiny是一个基于SODA数据集训练的超小型对话模型，专为边缘设备推理设计，体积仅为Cosmo-3B模型的2%左右。

Transformers 英语

Roberta Base Chinese Extractive Qa

基于RoBERTa架构的中文抽取式问答模型，适用于从给定文本中提取答案的任务。

问答系统中文

AIbase

智启未来，您的人工智能解决方案智库

简体中文

© 2025AIbase 备案号：闽ICP备08105208号-24