Sam2 Hiera Base Plus.fb R896
Apache-2.0
基于HieraDet图像编码器的SAM2模型,专注于图像特征提取任务。
图像分割
Transformers

S
timm
764
0
Dinov2 With Registers Base
Apache-2.0
基于DINOv2训练的视觉Transformer模型,通过添加寄存器标记优化注意力机制,提升特征提取能力
图像分类
Transformers

D
facebook
22.74k
5
Depth Anything V2 Small
Apache-2.0
Depth Anything V2 是目前性能最强的单目深度估计模型,基于大规模合成与真实图像训练,相比V1版本能捕捉更精细的细节且更鲁棒。
3D视觉 英语
D
depth-anything
55.22k
64
C RADIO
其他
NVIDIA开发的视觉特征提取模型,用于生成图像嵌入,支持下游任务如图像分类。
视觉特征提取
Transformers

C
nvidia
398
14
RADIO
由NVIDIA研发的视觉特征提取模型,可将图像转换为嵌入向量供下游任务使用
图像特征提取
Transformers

R
nvidia
5,166
36
Esm1b T33 650M UR50S
MIT
ESM-1b是基于Transformer的蛋白质语言模型,通过无监督学习蛋白质序列数据,可用于蛋白质结构和功能预测。
蛋白质模型
Transformers

E
facebook
24.20k
18
Wav2vec2 Nsc Final 1 Google Colab
基于wav2vec2架构的语音处理模型,训练细节未完全公开
语音识别
Transformers

W
YuanWellspring
99
0
Assignment1 Omar
Apache-2.0
Wav2Vec2是一个基于自监督学习的语音识别模型,在LibriSpeech 960小时语音数据上预训练和微调,支持英语语音转录。
语音识别
Transformers 英语

A
Classroom-workshop
28
0
Response Quality Classifier Large
MIT
该模型用于评估对话中最后一条消息的相关性和具体性,基于sberbank-ai/ruRoberta-large架构。
对话系统
Transformers 其他

R
t-bank-ai
33
11
Viwav2vec2 Base 1.5k
该模型通过1.5千小时越南语语音数据预训练得到,适用于越南语语音识别任务,需微调后使用。
语音识别
Transformers 其他

V
dragonSwing
38
0
Wav2vec2 Large El Voxpopuli V2
基于VoxPopuli语料库预训练的希腊语语音识别模型,使用17.7小时未标注数据
语音识别
Transformers 其他

W
facebook
24
0
Wav2vec2 Large 100k Voxpopuli
基于VoxPopuli语料库10万条无标注数据预训练的语音识别模型,支持多语言语音表征学习
语音识别 其他
W
facebook
2,218
4
Wav2vec2 Base Pt Voxpopuli V2
基于葡萄牙语VoxPopuli语料库预训练的Wav2Vec2基础模型,适用于语音识别任务
语音识别
Transformers 其他

W
facebook
30
0
Wav2vec2 Large Uralic Voxpopuli V2
基于VoxPopuli语料库的42.5小时乌拉尔语系无标注数据预训练的Wav2Vec2大型语音模型
语音识别
Transformers

W
facebook
46
0
Wav2vec2 Large West Germanic Voxpopuli V2
Facebook的Wav2Vec2大型模型,仅在西日耳曼语系的VoxPopuli语料库66.3无标注数据上进行预训练。
语音识别
Transformers

W
facebook
25
1
Wav2vec2 Large Nl Voxpopuli
基于VoxPopuli语料库荷兰语子集预训练的自动语音识别模型
语音识别 其他
W
facebook
18
0
Wav2vec2 Base Sv Voxpopuli
基于VoxPopuli语料库瑞典语子集预训练的Wav2Vec2基础模型,适用于瑞典语语音识别任务。
语音识别
Transformers 其他

W
facebook
33
0
Mt5 Xxl
Apache-2.0
mT5是谷歌推出的多语言文本到文本转换模型,支持101种语言,基于mC4数据集预训练,适用于多种NLP任务。
大型语言模型
Transformers 支持多种语言

M
google
7,532
68
Wav2vec2 Base Nl Voxpopuli V2
基于Facebook Wav2Vec2架构的语音模型,专门针对荷兰语进行预训练,使用VoxPopuli语料库中的19.0k未标注数据。
语音识别
Transformers 其他

W
facebook
22
0
Wav2vec2 Base Es Voxpopuli
基于VoxPopuli西班牙语无标注数据预训练的Wav2Vec2语音识别基础模型
语音识别
Transformers 西班牙语

W
facebook
39
2
Wav2vec2 Base De Voxpopuli V2
基于Facebook Wav2Vec2架构的德语语音预训练模型,使用VoxPopuli语料库中的23.2k未标注德语数据进行预训练。
语音识别
Transformers 德语

W
facebook
44
1
Wav2vec2 Base Et Voxpopuli V2
基于Facebook Wav2Vec2框架的语音模型,专门针对爱沙尼亚语进行预训练
语音识别
Transformers 其他

W
facebook
30
0
Gpt2 Distil Chinese Cluecorpussmall
基于CLUECorpusSmall预训练的中文GPT2轻量级模型,参数规模为6层/768隐藏层,适用于中文文本生成任务
大型语言模型 中文
G
uer
1,043
20
Wav2vec2 Base Pl Voxpopuli V2
基于VoxPopuli语料库的波兰语Wav2Vec2基础模型,适用于语音识别任务
语音识别
Transformers 其他

W
facebook
30
0
Wav2vec2 Base Da Voxpopuli V2
基于Facebook Wav2Vec2架构的语音模型,专门针对丹麦语进行预训练,使用VoxPopuli语料库的13.6k未标注数据。
语音识别
Transformers 其他

W
facebook
35
0
Wav2vec2 Base Cs Voxpopuli V2
基于VoxPopuli语料库预训练的Wav2Vec2基础模型,专注于捷克语语音处理
语音识别
Transformers 其他

W
facebook
33
1
T5 V1 1 Xl
Apache-2.0
T5 1.1是谷歌改进的文本到文本转换Transformer模型,采用GEGLU激活函数和优化架构,仅使用C4数据集进行无监督预训练
大型语言模型
Transformers 英语

T
google
30.17k
15
Mt5 Large
Apache-2.0
mT5是谷歌推出的多语言文本到文本转换模型,支持101种语言,基于mC4数据集预训练。
大型语言模型 支持多种语言
M
google
404.82k
90
Wav2vec2 Base Sk Voxpopuli V2
基于VoxPopuli语料库中斯洛伐克语数据预训练的Wav2Vec2基础模型,适用于语音识别任务。
语音识别
Transformers 其他

W
facebook
31
0
Wav2vec2 Base Lv Voxpopuli V2
基于Facebook Wav2Vec2架构的语音识别基础模型,专门针对拉脱维亚语(lv)进行预训练,使用VoxPopuli语料库的13.1k未标注数据。
语音识别
Transformers 其他

W
facebook
29
1
Wav2vec2 Base Fr Voxpopuli
基于VoxPopuli法语无标注数据预训练的Wav2Vec2基础模型,适用于法语语音识别任务
语音识别
Transformers 法语

W
facebook
30
0
Wav2vec2 Base Bg Voxpopuli V2
基于Facebook Wav2Vec2架构的语音模型,专门针对保加利亚语进行预训练,适用于语音识别任务。
语音识别
Transformers 其他

W
facebook
30
0
Wav2vec2 Base Lt Voxpopuli V2
这是一个基于Facebook Wav2Vec2架构的语音模型,专门针对立陶宛语进行了预训练,使用了VoxPopuli语料库中的14.4k未标记数据。
语音识别
Transformers 其他

W
facebook
31
0
Wav2vec2 Large North Germanic Voxpopuli V2
基于北日耳曼语系VoxPopuli语料库预训练的大型语音模型
语音识别
Transformers

W
facebook
25
0
Wav2vec2 Large Romance Voxpopuli V2
Facebook的Wav2Vec2大型模型,仅在罗曼语族的VoxPopuli语料库101.5小时未标注数据上进行预训练,适用于语音识别任务。
语音识别
Transformers

W
facebook
26
0
Wav2vec2 Large Fr Voxpopuli
基于VoxPopuli法语语料库预训练的大型语音识别模型,支持法语语音转文本任务
语音识别 法语
W
facebook
31
0
Wav2vec2 Base Nl Voxpopuli
基于VoxPopuli语料库荷兰语子集预训练的Wav2Vec2基础模型,适用于荷兰语语音识别任务。
语音识别
Transformers 其他

W
facebook
31
0
Wav2vec2 Base It Voxpopuli
基于VoxPopuli意大利语无标注数据预训练的Wav2Vec2基础模型,适用于语音识别任务。
语音识别
Transformers 其他

W
facebook
32
0
Wav2vec2 Large Mt Voxpopuli V2
Facebook的Wav2Vec2大型模型,仅在马耳他语(mt)上使用VoxPopuli语料库的未标记数据进行预训练,适用于语音识别任务。
语音识别
Transformers 其他

W
facebook
25
0
Wav2vec2 Large It Voxpopuli
基于VoxPopuli意大利语无标注数据预训练的语音识别模型,采用Facebook的Wav2Vec2架构
语音识别 其他
W
facebook
55
0
- 1
- 2
精选推荐AI模型
Llama 3 Typhoon V1.5x 8b Instruct
专为泰语设计的80亿参数指令模型,性能媲美GPT-3.5-turbo,优化了应用场景、检索增强生成、受限生成和推理任务
大型语言模型
Transformers 支持多种语言

L
scb10x
3,269
16
Cadet Tiny
Openrail
Cadet-Tiny是一个基于SODA数据集训练的超小型对话模型,专为边缘设备推理设计,体积仅为Cosmo-3B模型的2%左右。
对话系统
Transformers 英语

C
ToddGoldfarb
2,691
6
Roberta Base Chinese Extractive Qa
基于RoBERTa架构的中文抽取式问答模型,适用于从给定文本中提取答案的任务。
问答系统 中文
R
uer
2,694
98
智启未来,您的人工智能解决方案智库
简体中文