新浪博客

从ChemDraw到PubChem

2015-01-13 09:37阅读:
PubChem,NCBI旗下有机小分子生物活性数据库。PubChem可由网站直接存取,包括结构、活性、来源及实验等多种数据,越来越为药学、化学工作者看重。 PubChem有多种搜索方式,可以使用常用名、商业编号、分子式,乃至三维结构来进行搜索,其中最准确的仍是二维结构搜索——但是PubChem的结构搜索插件使用麻烦,易出现问题——以及SMILES、InChI搜索。SMILES的获取方式很多,包括OpenBabel、DS等软件都可以将结构转成SMILES文件。


给大家介绍一个更为简单的方法,利用我们最熟悉的ChemDraw来获取SMILES或InChI


在ChemDraw中随便画个结构,比如下图的甲苯:
从ChemDraw到PubChem


选择结构,点击Edit菜单,选择Copy As:SMILES。或者可以直接使用快捷键Alt+Ctrl+C,即可复制完成。下面还有InChI选项。
从ChemDraw到PubChem


可以用Ctrl+V黏贴出来看一下甲苯的SMILES。
从ChemDraw到PubChem


PubChem中进入Structure Search,在Identity/Similarity或Substructure/Superstructure中都有CID, SMILES, InChI,将刚才复制出来的SMILES黏贴进去,直接search即可。当然也可以利用Edit打开结构编辑器对于所需要搜索的结构进行一定的调整,Preview则可以看到需要搜索的结构预览。
从ChemDraw到PubChem
从ChemDraw到PubChem


特别感谢@人生若只如初见 小童鞋提供的方法。


SMILES(Simplified molecular input line entry specification),简化分子线性输入规范,是一种用ASCII字符串明确描述分子结构的规范。SMILES由Arthur Weininger和David Weininger于20世纪80年代晚期开发,并由其他人,尤其是日光化学信息系统有限公司(Daylight Chemical Information Systems Inc.)修改和扩展。
由于SMILES用一串字符来描述一个三维化学结构,它必然要将化学结构转化成一个生成树,此系统采用纵向优先遍历树算法。转化时,先要去掉氢,还要把环打开。表示时,被拆掉的键端的原子要用数字标记,支链写在小括号里。
SMILES字符串可以被大多数分子编辑软件导入并转换成二维图形或分子的三维模型。转换成二维图形可以使用Helson的“结构图生成算法”(Structure Diagram Generation algorithms)。

我的更多文章

下载客户端阅读体验更佳

APP专享