網頁

2018年12月21日 星期五

GROMACS力場拓撲文件的創建




創建分子的拓撲文件:理論考慮

在利用GROMACS模擬一些不常見的分子時,首先要解決的一個問題就是如何得到分子的拓撲文件。 對於沒有力場參數的分子,這是一個難點。 只有理解了力場的概念,明白了拓撲文件的結構,清楚處理過程中每步的含義,才不至於被網上眾多的教程和工具弄糊塗。

理論上說,對每種分子我們都要發展一種特定的,適用於這種分子的力場。 但發展力場並不簡單,也不是每個人都可以做好的,因此在目前這種想法還不現實。 但隨著理論與工具的成熟,在可見的將來,我認為可以實現這一點。 這就像量子化學計算一樣,開始時只有一些專業人士才能使用,但現在已經基本普及了,任何人都可以拿來算算。 將來的力場也必然是這樣,你無論做什麼體系,都可以自己先做一個合適的力場出來,然後再去跑分子動力學模擬。

本質上說,無論哪個力場,包含再多的原子類型,都不可能描述所有可能的分子,因為分子的數目,連接方式幾乎是無窮的。 在發展一種力場時,最先要做的就是要確定力場所用的原子類型。 原子類型越多,對分子的描述就越準確,也越能用於更多種類的分子。 舉個例子,OPLS-AA力場原子類型最多,所以它能處理的分子類型遠遠多於AMBER等生物分子力場。

對蛋白質和核酸來說,其基本構建單元的數目有限,氨基酸殘基20種,核苷酸5種,所以在生物分子力場中甚至可以把每種原子的力場參數都列出來,放在 力場文件中,這樣對任意一個給定的殘基序列或DNA序列,都可以快速地從文件中找到相應的力場參數,完成拓撲文件的創建。這就是GROMACS的pdb2gmx模塊所做的工作。 因此,pdb2gmx這種工具只適用於生物分子,蛋白質,DNA,RNA等,而不能用於有機分子(如各種配體)和周期性體系(如無機材料,聚合物)。

對於有機分子來說,不存在基本構建單元,原子類型數目幾乎是無限的,所以不可能採用生物力場的的處理方式,而是要採用一些近似,把近似相同的原子基團當作基本的原子類型。 比如,乙烷中的甲基原子,乙醇中的甲基碳原子,這種種子原子理論來說不可能完全相同,但可以粗略地認為相同,指定為同樣的 原子類型,這就是OPLS-AA等力場採用的做法。 這些力場根據各種分子結構劃分出很多基本原子類型,希望能夠利用這些原子類型來描述所有可能的有機分子。 這當然存在問題,因為總有一些特殊的分子結構還沒有被包含在力場的原子類型中。

明白了上面的道理,我們就可以手動創建分子的拓撲文件了。怎麼做呢?很簡單,畫出分子結構,對照所選力場的原子類型表,確定分子中每個原子(或原子基團)的原子類型,然後根據原子類型及其相互作用參數寫出拓撲文件。當然,在這過程中分子中的某些原子可能無法在所選力場中找到對應的原子類型,那麼就只能退而得其次,選擇一個(你認為或源於參考文獻上)最接近的,就可以了。手動操作,對含10幾個原子的小分子還可以,對包含更多原子的分子,手動做起來就很耗時了,也很麻煩,還容易出錯。所以就有人寫了一些程序或腳本來自動處理這個的問題,但採用的方法是一樣的,就是先根據分子結構找到匹配的原子類型,然後將相應的相互作用參數寫為拓撲文件。 PRODRG,ATB等程序或網站的處理過程就是這樣。由於是使用程序自動處理,所以不可能像自己手動處理那樣準確,所以在得到這些程序給出的拓撲文件後,自己一定要核查一下,看是否存在錯誤。另外有些程序無法給出原子類型對應的電荷,這也需要單獨處理。

上面的方法也適用於週期性體系或是聚合物體系,但由於這些體係是由一些基本單元重複而成的,如果擴展到大的體係後,還使用上面的方法就顯得麻煩了,況又還有 週期性的問題,很多程序無法處理。 為此,GROMACS提供了x2top模塊,它可以根據提供的構型文件,設定的鍵長條件,計算所有可能的鍵,鍵角,二面角,並輸出一個初步的拓撲文件,將它加以修改 ,加入自己需要的參數就能做成一個可以使用的拓撲文件了。 因此,x2top只用於創建初步的拓撲文件,所用的力場和參數需要你自己處理,不要直接使用它給出的拓撲文件去做模擬。

這些輔助工具可以根據輸入構型自動判斷原子類型以及成鍵方式,雖然很不錯,但卻不能保證一定能找到最匹配的原子類型,況又還有許多原子類型之間的鍵合參數缺失,這時就需要我們自己根據情況來補充了。 我個人覺得,可以參考構建分子的方式,採用圖形化的方式,手動選擇原子類型來創建分子,這樣既方便,同時也能避免無法找到合適原子類型的問題。 可惜的是,至今我還沒有看到這樣的軟件。 有可能的話,或許可以自己開發一個。

實際上,各種創建拓撲文件的網站或是程序都只是起著輔助作用,得到拓撲文件後,在做模擬之前一定要檢查一下。

下面是創建分子拓撲文件時要考慮的幾點:

對同一模擬體系中的不同分子,盡量使用同一力場,這樣自洽性好。 比如,如果對蛋白質,核酸等生物大分子使用AMBER力場,那麼相應的配體小分子,建議使用與此對應的GAFF力場。這也是AMBER程序鼓勵的作法。
對一般有機分子溶液體系的模擬,建議使用全原子的OPLS-AA力場,這是專門針對有機溶液體系優化的力場,原子類型最多,實用性很強。 如果你想使用聯合原子力場,那麼你可以試試GROMOS力場。

創建分子的拓撲文件:各種工具
使用時需要先清楚每種工具給出的是什麼力場的拓撲文件,這樣才能選擇合適的程序。
     
生成GROMACS拓撲文件的各種工具
力场工具说明
AMBER GAFFAmberTools+ACPYPE推薦的標準做法
MKTOP簡單腳本,需要提供電荷
amb2gmx已廢棄,功能完全由acpype取代
CHARMMSwissParam待考
CGenFF用於CHARMM的通用力場,待考
GROMOSPRODRG自動生成拓撲的網絡服務器,經典工具,輸出文件需要檢查
ATB自動生成拓撲的網絡服務器,可能更好,輸出文件仍需檢查
OPLS-AATPPMKTOP目前最好
MKTOP簡單腳本,需要提供電荷
Topolbuild將Tripos.mol2文件轉換為拓撲,功能簡陋,不建議使用
TopolGen將全原子的pdb文件轉換為拓撲,功能簡陋,不建議使用
UFFOBGMX近似UFF力場,可作參考
生物分子力场pdb2gmxGROMACS通用工具,只用於蛋白質,DNA,RNA的生物分子
所有力场x2topGROMACS通用工具,一般用於週期性體系,聚合物等,只給出初步拓撲文件

創建分子的拓撲文件:實例教程

GAFF力場

OPLS-AA力場

  • TPPMKTOP:OPLS-AA全原子力場的GROMACS拓撲文件生成器

GROMOS力場

對小分子不建議使用GROMOS力場,因為其計算電荷的過程不清楚。 但由於PRODRG網站很方便,這裡還是提供一個說明,並結合Justin的論文說明如何修改。
  • 使用PRODRG或ATB創建

使用x2top並結合已知參數創建具有週期性體系的力場拓撲文件

GROMACS使用CHARMM力場參數




參考
https://jerkwin.github.io/2015/12/10/力场与拓扑之二-如何选择力场/















沒有留言:

張貼留言