多场景适用
Voc2vec Hubert Ls Pt
Apache-2.0
voc2vec是专为非语言人类数据设计的基础模型,基于HuBERT框架构建,在125小时非语言音频数据上预训练。
音频分类
Transformers
英语
V
alkiskoudounas
114
1
Nano Image Captioning
Apache-2.0
这是一个基于bert-tiny和vit-tiny的轻量级图像字幕生成模型,仅重40MB,在CPU上运行速度极快。
图像生成文本
Transformers
英语
N
cnmoro
184
3
Vitpose Plus Huge
Apache-2.0
ViTPose++是基于视觉Transformer的人体姿态估计基础模型,在MS COCO关键点测试集上达到81.1 AP的优异表现。
姿态估计
Transformers
V
usyd-community
14.49k
6
Negclip
MIT
开放剪辑是一个零样本图像分类模型,能够在不进行微调的情况下对图像进行分类。
图像分类
N
Nano1337
92
0
Profanity Model 3.1
Apache-2.0
基于20万条文本数据训练而成的脏话检测模型,用于识别文本中的不当语言。
文本分类
Transformers
P
parsawar
1,120
1
Yolov10x
YOLOv10是一种实时端到端目标检测模型,具有高效的推理速度和较高的检测精度。
目标检测
Transformers
Y
onnx-community
23
6
Yolov10s
YOLOv10是清华大学MIG实验室开发的高效实时目标检测模型,提供端到端检测能力。
目标检测
Transformers
Y
onnx-community
13
7
Yolo Roofs
MIT
YOLOv8 是 Ultralytics 开发的一个高效的目标检测模型,基于 YOLO (You Only Look Once) 架构,适用于实时目标检测任务。
目标检测
Transformers
英语
Y
Vara971
15
0
Blip Large Long Cap
Bsd-3-clause
基于BLIP微调的长文本图像描述生成器,适用于文生图提示和图像数据集标注
图像生成文本
Transformers
B
unography
26.87k
5
Whisper Small Dialect Classifier Cross
Apache-2.0
该模型是基于whisper-small架构的方言分类器,用于识别和分类特定方言的语音输入。
音频分类
Transformers
W
yaygomii
53
1
Distilvit
Apache-2.0
基于VIT图像编码器和蒸馏版GPT-2文本解码器的视觉语言模型,用于图像描述生成任务
图像生成文本
Transformers
D
Mozilla
290
19
Bert Finetuned Phishing
Apache-2.0
在钓鱼数据集上微调的BERT模型,能检测网址、邮件、短信和网站中的钓鱼攻击
文本分类
Transformers
英语
B
ealvaradob
4,436
16
Llama 2 70B Chat GGUF
Llama 2 70B Chat是由Meta开发的70亿参数大型语言模型,专为对话任务优化。
大型语言模型
英语
L
TheBloke
3,578
123
Autotrain Multifamily V2 3736899404
这是一个使用AutoTrain训练的多类别图像分类模型,在验证集上达到了78.6%的准确率。
图像分类
Transformers
A
lineups-io
14
0
Everything V1
Openrail
基于Anything V3微调的动漫风格Stable Diffusion模型,支持通过danbooru标签生成高质量图像
图像生成
英语
E
TheRafal
90
12
Whisper Medium Tr
Apache-2.0
该模型是基于OpenAI的Whisper Medium模型在土耳其语数据集上微调的语音识别模型,词错误率显著降低。
语音识别
Transformers
其他
W
sgangireddy
81
4
Opus Mt Tc Big En Pt
这是一个用于英语到葡萄牙语(包括巴西葡萄牙语)的神经机器翻译模型,属于OPUS-MT项目的一部分。
机器翻译
Transformers
支持多种语言
O
Helsinki-NLP
65.51k
28
It5 Base Summarization
基于gsarti/it5-base微调的意大利语文本抽象摘要生成模型,能够生成意大利语文本的摘要。
文本生成
其他
I
efederici
29
0
Image Captioning Portuguese
Apache-2.0
这是一个能够将图像转换为葡萄牙语描述的模型,基于ViT和GPT2架构训练。
图像生成文本
其他
I
adalbertojunior
17
1
T5 Base Spellchecker
基于T5-Base变换器构建的拼写检查器,用于文本拼写错误的检测和修正。
大型语言模型
Transformers
T
Bhuvana
95
13