聚合全球优质AI模型 赋能下一代应用开发
调用全球AI模型,从通用到垂直,应有尽有

2637个模型符合条件

热门
最新
点赞量高
Indonesian Roberta Base Posp Tagger
MIT
这是一个基于印尼语RoBERTa模型微调的词性标注模型,在indonlu数据集上训练,用于印尼语文本的词性标注任务。
序列标注
Transformers
其他
I
w11wo
2.2M
7
Gender Classification
一个基于PyTorch和HuggingPics构建的图像分类模型,用于识别图像中的性别
图像分类
Transformers
G
rizvandwiki
1.8M
48
Wav2vec2 Base Finetuned Speech Commands V0.02
Apache-2.0
该模型是基于facebook/wav2vec2-base在speech_commands数据集上微调的语音命令识别模型,准确率达97.59%。
音频分类
Transformers
W
0xb1
1.2M
0
Filipino Wav2vec2 L Xls R 300m Official
Apache-2.0
基于facebook/wav2vec2-xls-r-300m在菲律宾语音数据集上微调的语音识别模型
语音识别
Transformers
F
Khalsuu
1.2M
1
Gender Classification 2
这是一个基于PyTorch框架和HuggingPics工具生成的图像分类模型,专门用于性别分类任务。
图像分类
Transformers
G
rizvandwiki
906.98k
32
Bert Base Arabertv02
AraBERT是基于BERT架构的阿拉伯语预训练语言模型,专门针对阿拉伯语理解任务优化。
大型语言模型
阿拉伯语
B
aubmindlab
666.17k
35
Bloomz 560m
Openrail
BLOOMZ系列的中型多语言模型,适用于多种自然语言处理任务。
大型语言模型
Transformers
支持多种语言
B
bigscience
593.72k
122
Whisper Medium Fleurs Lang Id
Apache-2.0
基于OpenAI Whisper-medium微调的语音语种识别模型,在FLEURS数据集上达到88.05%准确率
音频分类
Transformers
W
sanchit-gandhi
590.30k
14
Distil Large V3
MIT
Distil-Whisper是Whisper large-v3的知识蒸馏版本,专注于英语自动语音识别,提供更快的推理速度同时保持接近原始模型的准确性。
语音识别
英语
D
distil-whisper
417.11k
311
Distilroberta Finetuned Financial News Sentiment Analysis
Apache-2.0
基于DistilRoBERTa微调的金融新闻情感分析模型,准确率达98.23%
文本分类
Transformers
D
mrm8488
310.81k
386
Wikineural Multilingual Ner
基于神经网络与知识库融合的多语言命名实体识别模型,支持9种语言
序列标注
Transformers
支持多种语言
W
Babelscape
258.08k
142
Whisper Small Ft Common Language Id
Apache-2.0
基于openai/whisper-small微调的通用语言识别模型,在评估集上准确率达88.6%
音频分类
Transformers
W
sanchit-gandhi
256.20k
2
Distil Medium.en
MIT
Distil-Whisper是Whisper模型的蒸馏版本,速度比原版快6倍,体积缩小49%,在英语语音识别任务上保持接近原版的性能。
语音识别
英语
D
distil-whisper
186.85k
120
Skin Type
一个用于分类人类皮肤类型的图像分类模型,致力于实现公平性,确保模型在所有肤色上都能正确表现。
图像分类
Transformers
S
driboune
182.21k
3
Ibert Roberta Base Abusive Or Threatening Speech
该模型是基于ibert-roberta-base微调得到的版本,专门用于检测辱骂或威胁性言论。
文本分类
Transformers
I
DunnBC22
174.14k
3
Wavlm Libri Clean 100h Base Plus
基于microsoft/wavlm-base-plus在LIBRISPEECH_ASR - CLEAN数据集上微调的自动语音识别模型
语音识别
Transformers
W
patrickvonplaten
126.17k
3
Bpmn Information Extraction V2
Apache-2.0
基于bert-base-cased微调的BPMN流程信息抽取模型,用于从文本化流程描述中提取执行者、任务等关键元素
序列标注
Transformers
B
jtlicardo
112.15k
14
Nb Wav2vec2 1b Nynorsk
Apache-2.0
基于Facebook/Meta的XLS-R特征提取器微调而成的新挪威语自动语音识别模型,在NPSC测试集上WER为11.32%。
语音识别
Transformers
其他
N
NbAiLab
96.58k
0
CLIP Convnext Large D 320.laion2B S29b B131k Ft Soup
MIT
基于ConvNeXt-Large架构的CLIP模型,在LAION-2B数据集上训练,支持零样本图像分类和图像文本检索任务
文本生成图像
TensorBoard
C
laion
83.56k
19
CLIP Convnext Large D.laion2b S26b B102k Augreg
MIT
基于LAION-2B数据集训练的大规模ConvNeXt-Large CLIP模型,支持零样本图像分类和图文检索任务
文本生成图像
TensorBoard
C
laion
80.74k
5
CLIP ViT L 14 Laion2b S32b B82k
MIT
基于OpenCLIP框架在LAION-2B英语子集上训练的视觉语言模型,支持零样本图像分类和图文检索
文本生成图像
TensorBoard
C
laion
79.01k
48
Nb Wav2vec2 300m Nynorsk
Apache-2.0
基于VoxRex特征提取器微调的300M参数语音识别模型,专为新挪威语(Nynorsk)优化,在NPSC测试集上WER达12.22%
语音识别
Transformers
其他
N
NbAiLab
73.53k
0
Yolov8m Table Extraction
基于YOLOv8m的目标检测模型,专门用于表格提取任务,能够检测带边框和无边框的表格。
目标检测
TensorBoard
Y
keremberke
69.06k
40
Yolov5n License Plate
基于YOLOv5n的轻量级车牌检测模型,专为车牌识别任务优化
目标检测
TensorBoard
Y
keremberke
68.64k
17
Table Detection And Extraction
基于YOLOv8s的表格检测模型,能够准确识别图像中的有边框和无边框表格。
目标检测
TensorBoard
英语
T
foduucom
55.45k
88
Distilbert NER
Apache-2.0
基于DistilBERT微调的轻量级命名实体识别模型,平衡性能与效率
序列标注
Transformers
英语
D
dslim
48.95k
34
Distil Large V2
MIT
Distil-Whisper是Whisper模型的蒸馏版本,速度提升6倍,体积缩小49%,在非分布评估集上的表现仅相差1% WER。
语音识别
英语
D
distil-whisper
42.65k
508
CLIP Convnext Base W Laion2b S13b B82k Augreg
MIT
基于ConvNeXt-Base架构的CLIP模型,使用OpenCLIP在LAION-5B子集上训练,专注于零样本图像分类任务
文本生成图像
TensorBoard
C
laion
40.86k
7
Wav2vec2 Lg Xlsr En Speech Emotion Recognition
Apache-2.0
基于Wav2Vec 2.0微调的语音情感识别模型,支持识别8种英语情感,在RAVDESS数据集上准确率达82.23%
音频分类
Transformers
W
ehcalabres
39.83k
221
Gender Classification
Apache-2.0
基于distilbert-base-uncased微调的性别分类模型,在评估集上准确率达到1.0
文本分类
Transformers
G
padmajabfrl
39.68k
29
Distil Small.en
MIT
Distil-Whisper是Whisper模型的蒸馏版本,速度快6倍,体积缩小49%,在非分布评估集上表现接近1% WER。
语音识别
Transformers
英语
D
distil-whisper
33.51k
97
English Filipino Wav2vec2 L Xls R Test 09
Apache-2.0
基于jonatasgrosman/wav2vec2-large-xlsr-53-english微调的英语-菲律宾语语音识别模型,在评估集上WER为0.5750
语音识别
Transformers
E
Khalsuu
29.03k
1
Yolov8s Signature Detector
基于YOLOv8s微调的手写签名检测模型,专门用于文档图像中的签名定位
目标检测
TensorBoard
Y
tech4humans
28.14k
15
Nb Whisper Tiny Verbatim
Apache-2.0
挪威国家图书馆基于OpenAI Whisper开发的挪威语自动语音识别模型,专门针对逐字转录场景优化,输出全小写无标点文本
语音识别
支持多种语言
N
NbAiLabBeta
24.54k
2
Nb Wav2vec2 1b Bokmaal
Apache-2.0
基于Facebook/Meta的XLS-R特征提取器微调的挪威语自动语音识别模型,在NPSC测试集上词错误率6.33%
语音识别
Transformers
其他
N
NbAiLab
23.95k
3
Biomistral 7B
Apache-2.0
BioMistral是基于Mistral架构、针对医学领域优化的开源大语言模型,通过PubMed Central开放获取文本数据继续预训练,支持多语言医学问答任务。
大型语言模型
Transformers
支持多种语言
B
BioMistral
22.59k
428
Aragpt2 Base
AraGPT2是基于Transformer架构的阿拉伯语生成预训练模型,由AUB MIND实验室开发,支持多种规模的模型变体。
大型语言模型
阿拉伯语
A
aubmindlab
21.26k
25
Cner Base
CNER模型是一个基于DeBERTa-v3-base架构的命名实体识别模型,能够联合识别和分类带有细粒度标签的概念和命名实体。
序列标注
Transformers
英语
C
Babelscape
20.66k
6
Fullstop Punctuation Multilingual Base
MIT
FullStop是一个基于Transformer的多语言标点符号预测模型,支持英语、德语、法语、意大利语、荷兰语等多种语言。
序列标注
Transformers
支持多种语言
F
oliverguhr
19.41k
6
Spelling Correction English Base
MIT
这是一个实验性模型,旨在修正英语文本中的拼写错误和标点符号。
文本生成
Transformers
英语
S
oliverguhr
17.59k
76
Vit Base Patch16 224 In21k Finetuned Cifar10
Apache-2.0
基于Google Vision Transformer (ViT)架构的预训练模型,在CIFAR-10数据集上进行了微调,用于图像分类任务。
图像分类
Transformers
V
aaraki
16.69k
10
Yolov5m License Plate
基于YOLOv5m架构的车牌目标检测模型,在车牌检测任务上表现出色。
目标检测
TensorBoard
Y
keremberke
15.13k
47