C

Chemberta Zinc Base V1

由 seyonec 开发
基于RoBERTa架构的Transformer模型,专为化学SMILES字符串的掩码语言建模任务设计
下载量 323.83k
发布时间 : 3/2/2022
模型介绍
内容详情
替代品

模型简介

该模型通过预训练学习化学SMILES字符串的表示,能够预测分子序列中的标记,并可用于分子性质预测和结构分析

模型特点

化学SMILES专用预训练
在ZINC数据集上专门针对化学SMILES表示法进行预训练
分子性质预测能力
学习到的表征可用于预测毒性、溶解性、类药性等分子性质
注意力可视化
提供注意力机制可视化工具,帮助识别影响化学性质的重要子结构
迁移学习基础
可作为图卷积和注意力模型的特征提取器,或用于BERT微调

模型能力

化学SMILES序列预测
分子变体生成
分子性质预测
化学子结构识别

使用案例

药物发现
分子性质优化
预测和优化候选药物的溶解性、毒性等性质
化学教育
子结构识别教学
通过注意力可视化帮助学生理解影响化学性质的关键结构
材料设计
分子变体生成
在可探索的化学空间内预测分子的合理变体