DAM 3B Self Contained
其他
DAM-3B是一个能够根据用户指定的图像区域(点/框/涂鸦/掩码)生成精细化局部描述的视觉语言模型。
图像生成文本
英语
D
nvidia
824
17
Perception LM 8B
其他
Meta发布的基于PyTorch框架的预训练语言模型,适用于非商业研究用途。
大型语言模型
英语
P
facebook
638
28
Perception LM 1B
其他
Meta发布的基于PyTorch的预训练语言模型,适用于非商业研究用途
大型语言模型
PyTorch
英语
P
facebook
1,140
17
Finseer
首个专为金融时间序列预测设计的检索器,基于检索增强生成(RAG)框架
大型语言模型
Transformers

英语
F
TheFinAI
13
1
SPIDER Skin Model
SPIDER-皮肤模型是一个专为皮肤病理切片分类设计的深度学习模型,属于SPIDER数据集计划的一部分。
图像分类
Transformers

S
histai
94
1
Centurio Aya
Centurio 是一个开源的多语言大型视觉语言模型,支持100种语言,具备图像文本到文本的处理能力。
图像生成文本
Transformers

支持多种语言
C
WueNLP
29
4
Mobilellm 125M Layer Share
该模型采用FAIR非商业研究许可,适用于非商业研究用途,遵循FAIR可接受使用政策。
大型语言模型
Transformers

M
facebook
101
7
Mobilellm 350M
Meta发布的研究模型,适用于非商业研究用途
大型语言模型
Transformers

M
facebook
361
35
Theia Base Patch16 224 Cddsv
其他
忒伊亚是一个面向机器人学习的视觉基础模型,通过蒸馏多个视觉基础模型获得丰富的视觉表征能力
3D视觉
Transformers

T
theaiinstitute
5,404
2
Eagle X5 34B Chat
Eagle是一系列以视觉为中心的高分辨率多模态大语言模型,通过混合不同架构和知识领域的视觉编码器增强多模态LLM的感知能力。
图像生成文本
Transformers

E
NVEagle
195
1
Theia Base Patch16 224 Cdiv
其他
忒伊亚是面向机器人学习的视觉基础模型,通过蒸馏多个现成的视觉基础模型构建,具有丰富的视觉表征能力。
图像分类
Transformers

T
theaiinstitute
7,621
8
C4ai Command R Plus 4bit
Command R+是Cohere实验室开发的1040亿参数开放权重研究级模型,支持多语言和复杂任务自动化。
大型语言模型
Transformers

支持多种语言
C
CohereForAI
707
253
C4ai Command R V01
Command-R是一个350亿参数的高性能生成模型研究版,专为推理、摘要和问答等场景优化,支持10种语言的生成能力,并具有卓越的检索增强生成(RAG)性能。
大型语言模型
Transformers

支持多种语言
C
CohereLabs
9,243
1,084
Openlrm Mix Base 1.1
OpenLRM是论文LRM的开源实现,能够从单张图像生成3D模型,包含不同规模的多个版本。
3D视觉
Transformers

O
zxhezexin
10.25k
6
Openlrm Obj Base 1.1
OpenLRM是论文LRM的开源实现,用于从单张图像生成3D模型
3D视觉
Transformers

O
zxhezexin
23
2
Openlrm Obj Small 1.1
OpenLRM是论文LRM的开源实现,用于从单张图像生成3D模型
3D视觉
Transformers

O
zxhezexin
58
1
Openlrm Large Obj 1.0
OpenLRM是论文LRM的开源实现,能够从单张图像生成3D模型。
3D视觉
Transformers

O
zxhezexin
15
5
Openlrm Small Obj 1.0
OpenLRM是论文LRM的开源实现,专注于从单张图像生成3D模型
3D视觉
Transformers

O
zxhezexin
35
6
T5 11b Trueteacher And Anli
TrueTeacher是一个基于T5-11B架构的事实一致性评估模型,专门用于评估摘要中的事实一致性。
大型语言模型
Transformers

英语
T
google
444
16
Musicgen Melody
MusicGen是一个简单可控的音乐生成模型,能够根据文本描述或旋律输入生成高质量音乐。
音频生成
Transformers

M
facebook
3,632
216
IF I M V1.0
DeepFloyd IF 是一款基于像素的三级级联扩散模型,能以当前最优水平生成具有照片级真实感和语言理解能力的图像。
文本生成图像
I
DeepFloyd
3,140
55
IF I L V1.0
DeepFloyd-IF是基于像素的三级级联扩散模型,能以全新水准实现照片级真实感和语言理解。
文本生成图像
I
DeepFloyd
4,299
20
IF II L V1.0
DeepFloyd-IF是基于像素的三级级联扩散模型,能以卓越的写实性和语言理解生成图像,零样本FID-30K得分达6.66。
文本生成图像
I
DeepFloyd
33.76k
53
精选推荐AI模型
Llama 3 Typhoon V1.5x 8b Instruct
专为泰语设计的80亿参数指令模型,性能媲美GPT-3.5-turbo,优化了应用场景、检索增强生成、受限生成和推理任务
大型语言模型
Transformers

支持多种语言
L
scb10x
3,269
16
Cadet Tiny
Openrail
Cadet-Tiny是一个基于SODA数据集训练的超小型对话模型,专为边缘设备推理设计,体积仅为Cosmo-3B模型的2%左右。
对话系统
Transformers

英语
C
ToddGoldfarb
2,691
6
Roberta Base Chinese Extractive Qa
基于RoBERTa架构的中文抽取式问答模型,适用于从给定文本中提取答案的任务。
问答系统
中文
R
uer
2,694
98
AIbase是一个专注于MCP服务的平台,为AI开发者提供高质量的模型上下文协议服务,助力AI应用开发。
简体中文