M

Materials.smi Ted

由 ibm-research 开发
IBM提出的化学语言基础模型,支持分子表示转换与量子属性预测等多种任务
下载量 20.65k
发布时间 : 7/25/2024
模型介绍
内容详情
替代品

模型简介

SMI-TED是基于SMILES的大型化学基础编解码模型,在9100万分子样本上预训练,支持分子表示转换和量子属性预测等复杂任务

模型特点

多模态分子表示
支持SMILES字符串、SELFIES编码、3D原子坐标等多种分子表示形式
大规模预训练
在PubChem的9100万分子样本(40亿标记)上进行预训练
双训练策略
结合掩码语言模型和编解码策略优化模型表现

模型能力

分子表示转换
量子属性预测
SMILES编码与解码
分子特征提取

使用案例

材料发现
新型分子设计
通过分子表示学习生成潜在的新型化合物
药物研发
分子属性预测
预测候选药物的量子化学性质
在MoleculeNet基准测试中表现优异