網頁

2019年10月6日 星期日

RDKit指令

1. MolFromSmiles

mol = Chem.MolFromSmiles('C(C)CC')
print(mol)

將SMILE轉成Mol格式,可以使用在像是fingerprint的引數
fp1 = MACCSkeys.GenMACCSKeys(mol)

https://blog.csdn.net/u012325865/article/details/81784517

2. MolToSmiles

smi = Chem.MolToSmiles(mol)
print(smi)



可以將Mol格式轉成SMILE

3. Canonicalization
Chem.MolToSmiles(Chem.MolFromSmiles(smi), isomericSmiles=True, canonical=True)

在大多數情況下,對於同一結構,可能有許多SMILES字符串。Canonicalization是將所有可能的SMILES字串轉換成一種canonical SMILES。假設您要在dataset中查找是否已經存在某結構。使用canonical SMILES代替2-d圖形結構可以將問題簡化為簡單的文本匹配問題。從dataset中每個化合物的canonical SMILES,並將查詢的結構轉換為其canonical SMILES。如果該SMILES不存在,代表它會是一個新的結構。

https://ctr.fandom.com/wiki/Convert_a_SMILES_string_to_canonical_SMILES

4.











沒有留言:

張貼留言