无监督预训练

# 无监督预训练

Sam2 Hiera Base Plus.fb R896

基于HieraDet图像编码器的SAM2模型，专注于图像特征提取任务。

Dinov2 With Registers Base

基于DINOv2训练的视觉Transformer模型，通过添加寄存器标记优化注意力机制，提升特征提取能力

Depth Anything V2 Small

Depth Anything V2 是目前性能最强的单目深度估计模型，基于大规模合成与真实图像训练，相比V1版本能捕捉更精细的细节且更鲁棒。

NVIDIA开发的视觉特征提取模型，用于生成图像嵌入，支持下游任务如图像分类。

视觉特征提取

由NVIDIA研发的视觉特征提取模型，可将图像转换为嵌入向量供下游任务使用

图像特征提取

Esm1b T33 650M UR50S

ESM-1b是基于Transformer的蛋白质语言模型，通过无监督学习蛋白质序列数据，可用于蛋白质结构和功能预测。

蛋白质模型

Wav2vec2 Nsc Final 1 Google Colab

基于wav2vec2架构的语音处理模型，训练细节未完全公开

Assignment1 Omar

Wav2Vec2是一个基于自监督学习的语音识别模型，在LibriSpeech 960小时语音数据上预训练和微调，支持英语语音转录。

Transformers 英语

Classroom-workshop

Response Quality Classifier Large

该模型用于评估对话中最后一条消息的相关性和具体性，基于sberbank-ai/ruRoberta-large架构。

Transformers 其他

Viwav2vec2 Base 1.5k

该模型通过1.5千小时越南语语音数据预训练得到，适用于越南语语音识别任务，需微调后使用。

Transformers 其他

Wav2vec2 Large El Voxpopuli V2

基于VoxPopuli语料库预训练的希腊语语音识别模型，使用17.7小时未标注数据

Transformers 其他

Wav2vec2 Large 100k Voxpopuli

基于VoxPopuli语料库10万条无标注数据预训练的语音识别模型，支持多语言语音表征学习

语音识别其他

Wav2vec2 Base Pt Voxpopuli V2

基于葡萄牙语VoxPopuli语料库预训练的Wav2Vec2基础模型，适用于语音识别任务

Transformers 其他

Wav2vec2 Large Uralic Voxpopuli V2

基于VoxPopuli语料库的42.5小时乌拉尔语系无标注数据预训练的Wav2Vec2大型语音模型

Wav2vec2 Large West Germanic Voxpopuli V2

Facebook的Wav2Vec2大型模型，仅在西日耳曼语系的VoxPopuli语料库66.3无标注数据上进行预训练。

Wav2vec2 Large Nl Voxpopuli

基于VoxPopuli语料库荷兰语子集预训练的自动语音识别模型

语音识别其他

Wav2vec2 Base Sv Voxpopuli

基于VoxPopuli语料库瑞典语子集预训练的Wav2Vec2基础模型，适用于瑞典语语音识别任务。

Transformers 其他

mT5是谷歌推出的多语言文本到文本转换模型，支持101种语言，基于mC4数据集预训练，适用于多种NLP任务。

大型语言模型

Transformers 支持多种语言

Wav2vec2 Base Nl Voxpopuli V2

基于Facebook Wav2Vec2架构的语音模型，专门针对荷兰语进行预训练，使用VoxPopuli语料库中的19.0k未标注数据。

Transformers 其他

Wav2vec2 Base Es Voxpopuli

基于VoxPopuli西班牙语无标注数据预训练的Wav2Vec2语音识别基础模型

Transformers 西班牙语

Wav2vec2 Base De Voxpopuli V2

基于Facebook Wav2Vec2架构的德语语音预训练模型，使用VoxPopuli语料库中的23.2k未标注德语数据进行预训练。

Transformers 德语

Wav2vec2 Base Et Voxpopuli V2

基于Facebook Wav2Vec2框架的语音模型，专门针对爱沙尼亚语进行预训练

Transformers 其他

Gpt2 Distil Chinese Cluecorpussmall

基于CLUECorpusSmall预训练的中文GPT2轻量级模型，参数规模为6层/768隐藏层，适用于中文文本生成任务

大型语言模型中文

Wav2vec2 Base Pl Voxpopuli V2

基于VoxPopuli语料库的波兰语Wav2Vec2基础模型，适用于语音识别任务

Transformers 其他

Wav2vec2 Base Da Voxpopuli V2

基于Facebook Wav2Vec2架构的语音模型，专门针对丹麦语进行预训练，使用VoxPopuli语料库的13.6k未标注数据。

Transformers 其他

Wav2vec2 Base Cs Voxpopuli V2

基于VoxPopuli语料库预训练的Wav2Vec2基础模型，专注于捷克语语音处理

Transformers 其他

T5 1.1是谷歌改进的文本到文本转换Transformer模型，采用GEGLU激活函数和优化架构，仅使用C4数据集进行无监督预训练

大型语言模型

Transformers 英语

mT5是谷歌推出的多语言文本到文本转换模型，支持101种语言，基于mC4数据集预训练。

大型语言模型支持多种语言

Wav2vec2 Base Sk Voxpopuli V2

基于VoxPopuli语料库中斯洛伐克语数据预训练的Wav2Vec2基础模型，适用于语音识别任务。

Transformers 其他

Wav2vec2 Base Lv Voxpopuli V2

基于Facebook Wav2Vec2架构的语音识别基础模型，专门针对拉脱维亚语（lv）进行预训练，使用VoxPopuli语料库的13.1k未标注数据。

Transformers 其他

Wav2vec2 Base Fr Voxpopuli

基于VoxPopuli法语无标注数据预训练的Wav2Vec2基础模型，适用于法语语音识别任务

Transformers 法语

Wav2vec2 Base Bg Voxpopuli V2

基于Facebook Wav2Vec2架构的语音模型，专门针对保加利亚语进行预训练，适用于语音识别任务。

Transformers 其他

Wav2vec2 Base Lt Voxpopuli V2

这是一个基于Facebook Wav2Vec2架构的语音模型，专门针对立陶宛语进行了预训练，使用了VoxPopuli语料库中的14.4k未标记数据。

Transformers 其他

Wav2vec2 Large North Germanic Voxpopuli V2

基于北日耳曼语系VoxPopuli语料库预训练的大型语音模型

Wav2vec2 Large Romance Voxpopuli V2

Facebook的Wav2Vec2大型模型，仅在罗曼语族的VoxPopuli语料库101.5小时未标注数据上进行预训练，适用于语音识别任务。

Wav2vec2 Large Fr Voxpopuli

基于VoxPopuli法语语料库预训练的大型语音识别模型，支持法语语音转文本任务

语音识别法语

Wav2vec2 Base Nl Voxpopuli

基于VoxPopuli语料库荷兰语子集预训练的Wav2Vec2基础模型，适用于荷兰语语音识别任务。

Transformers 其他

Wav2vec2 Base It Voxpopuli

基于VoxPopuli意大利语无标注数据预训练的Wav2Vec2基础模型，适用于语音识别任务。

Transformers 其他

Wav2vec2 Large Mt Voxpopuli V2

Facebook的Wav2Vec2大型模型，仅在马耳他语（mt）上使用VoxPopuli语料库的未标记数据进行预训练，适用于语音识别任务。

Transformers 其他

Wav2vec2 Large It Voxpopuli

基于VoxPopuli意大利语无标注数据预训练的语音识别模型，采用Facebook的Wav2Vec2架构

语音识别其他

精选推荐AI模型

Llama 3 Typhoon V1.5x 8b Instruct

专为泰语设计的80亿参数指令模型，性能媲美GPT-3.5-turbo，优化了应用场景、检索增强生成、受限生成和推理任务

大型语言模型

Transformers 支持多种语言

Cadet-Tiny是一个基于SODA数据集训练的超小型对话模型，专为边缘设备推理设计，体积仅为Cosmo-3B模型的2%左右。

Transformers 英语

Roberta Base Chinese Extractive Qa

基于RoBERTa架构的中文抽取式问答模型，适用于从给定文本中提取答案的任务。

问答系统中文

AIbase

智启未来，您的人工智能解决方案智库

简体中文

© 2025AIbase 备案号：闽ICP备08105208号-24