Uni 3DAR
模型简介
Uni-3DAR是一个自回归模型,统一了多种3D任务,支持生成和理解任务,具有高效性和高精度。
模型特点
统一处理多种3D数据类型
专注于分子、蛋白质和晶体等微观结构,但方法可无缝应用于宏观3D结构。
支持多样化任务
单个模型支持广泛的生成和理解任务。
高效性
通过八叉树压缩与两级子树压缩结合,仅用数百个令牌表示完整3D空间,推理速度比基于扩散的模型快得多。
高精度
基于八叉树压缩,对细粒度3D补丁进行令牌化以保持结构细节,生成质量显著优于之前的基于扩散的模型。
模型能力
3D生成
3D理解
分子生成
蛋白质生成
晶体生成
使用案例
化学与生物学
分子生成
生成具有特定性质的分子结构。
生成质量显著优于之前的基于扩散的模型。
蛋白质生成
生成具有特定功能的蛋白质结构。
晶体生成
生成具有特定物理性质的晶体结构。
精选推荐AI模型
Qwen2.5 VL 7B Abliterated Caption It I1 GGUF
Apache-2.0
Qwen2.5-VL-7B-Abliterated-Caption-it的量化版本,支持多语言图像描述任务。
图像生成文本
Transformers 支持多种语言

Q
mradermacher
167
1
Nunchaku Flux.1 Dev Colossus
其他
Colossus Project Flux 的 Nunchaku 量化版本,旨在根据文本提示生成高质量图像。该模型在优化推理效率的同时,将性能损失降至最低。
图像生成 英语
N
nunchaku-tech
235
3
Qwen2.5 VL 7B Abliterated Caption It GGUF
Apache-2.0
这是一个基于Qwen2.5-VL-7B模型的静态量化版本,专注于图像描述生成任务,支持多种语言。
图像生成文本
Transformers 支持多种语言

Q
mradermacher
133
1
Olmocr 7B 0725 FP8
Apache-2.0
olmOCR-7B-0725-FP8是基于Qwen2.5-VL-7B-Instruct模型,使用olmOCR-mix-0225数据集微调后量化为FP8版本的文档OCR模型。
图像生成文本
Transformers 英语

O
allenai
881
3
Lucy 128k GGUF
Apache-2.0
Lucy-128k是基于Qwen3-1.7B开发的专注于代理式网络搜索和轻量级浏览的模型,在移动设备上也能高效运行。
大型语言模型
Transformers 英语

L
Mungert
263
2