網頁

2020年3月21日 星期六

NAMD教學二十:拓撲文件

CHARMM力場拓撲文件包含將殘基名稱列表轉換為完整PSF結構文件所需的所有信息。它還包含內部坐標,允許自動分配坐標給晶體PDB文件中丟失的氫和其他原子。

CHARMM力場的當前版本是CHARMM22用於蛋白質,CHARMM27用於脂質和核酸,包括對蛋白質的CMAP校正。各個拓撲文件分別命名為top_all22_prot_cmap.inp、top_all27_lipid.rtf和top_all27_na.rtf。為了在混合系統上進行計算,還提供了組合版,名為top_all27_na_lipid.rtf,

top_all27_prot_lipid.rtf和top_all27_prot_na.rtf都可以在CHARMM31版本中找到。雖然與NAMD一起使用的工具允許同時使用多個拓撲和參數文件,但最好使用這些預先組合的文件。 CHARMM31版本可從MacKerell網站下載:

http://mackerell.umaryland.edu/charmm_ff.shtml

我們將檢查top_all27_prot_lipid.rtf;其他文件相似。文件開頭是頭文件,用以*s開頭的行表示,在本例中用“31 1”表示生成文件的CHARMM版本:

image.png

拓撲文件中的註釋由“!”表示,可以在行的任何地方出現。重要的使用信息通常包含在這些註釋中,因此在使用文本編輯器構建結構時,最好在文本編輯器中檢查拓撲文件。文件的下一部分是一長串註釋,其中包含文章的參考文獻和文件中參數的其他來源:

image.png

拓撲文件必須定義每個殘基中每個原子的類型、質量和電荷,以便可以構建PSF文件。雖然分配給同一類型原子的部分電荷在殘基之間變化,但它們的質量並不會變化。因此,每種原子類型的質量在文件開頭的mass描述中僅聲明一次。此描述還將一個整數與每個類型名配對,該名稱用於CHARMM格式的PSF文件,但不用於NAMD使用的X-PLOR格式的PSF文件。類型索引是唯一的,但不一定是連續的。注意以下內容,除了有許多類型的氫和碳原子被定義,但是原子質量是相同的:

image.png

當指定蛋白質中殘基鏈的連續性時,有必要參考前一殘基或後一殘基中的原子。 CHARMM拓撲文件聲明那些將在相鄰殘基中引用的原子類型,如下所示:

image.png

鏈的第一個和最後一個殘基顯然與中間的殘基具有不同的連續性,因為它們少了一個相鄰者。這是通過patch residues,通常稱為patches,來進行處理的。如圖所示,當殘基是段中的第一個或最後一個殘基時,任何殘基都可以指定要應用patch。但是,整個文件的默認設置,如下所示,其中默認patch程序是片段的第一個殘基為NTER,而最後一個殘基為CTER:

DEFA FIRS NTER LAST CTER

雖然原子間的共價鍵連接必須由拓撲文件提供,但枚舉所有所需的角度和二面體將是乏味且容易出錯的,而且非常複雜,因為由肽鍵連接的殘基的每個組合都需要不同的設置。因此,當建立一個片段時,每對或三個連接而成的鍵都會自動生成角度和二面角。此自動生成在每一個片段可能有效也可能無效,而且它不應用於水分子,但默認值在拓撲文件中定義:

AUTO ANGLES DIHE

我們現在準備好了實際的殘基定義,從丙氨酸開始,如下所示。殘基由RESI聲明表示,並帶有殘基名稱(ALA)和總電荷(0.00)。接下來,ATOM聲明列出了中殘基的所有原子,原子名稱(N,HN,CA)、類型(NH1,H,CT1)和部分電荷(-0.47,0.31,0.07)。將原子劃分成整數電荷組的聲明不被NAMD使用,也不應與氫原子組混淆,每個氫原子和與之結合的所有氫原子,NAMD用於加速非結合計算的距離測試。

image.png

如上所述,角度項和二面角項將是自生成的,因此不列出這兩項。但是,不太常見的不正確二面角(通常稱為impropers)必須顯式列出。在這種情況下,有兩個improper,維持了肽鍵的平面性,就像二面角一樣,improper中的原子順序可能被顛倒。如下圖所示,impropers由IMPR語句指定,後跟四個原子的集合,其他三個原子與之結合的中心原子通常列在前面。

IMPR N -C CA HN C CA +N O

由於CMAP修正項僅適用於主鏈二面角,因此也應明確列出,如CMAP語句之後所示。

CMAP -C N CA C N CA C +N

顯式氫鍵項不再存在於CHARMM力場中,因此不由NAMD計算。供體和受體聲明,如下所示,指定了有資格形成氫鍵的原子對。 VMD中的psfgen模塊忽略這些語句,並且不將氫鍵信息合併到PSF文件中。

DONOR HN N

ACCEPTOR O C

最後,殘基定義是IC聲明的內部坐標,對於每組四個原子1234,IC按順序指定鍵長1-2、角1-2-3、二面角1-2-3-4、角2 -3-4和鍵長3-4。利用這組數據,原子1的位置可以基於原子2–4的位置來確定,原子4的位置可以基於原子1–3的位置來確定,從而允許基於三原子種子遞歸生成結構中所有原子的坐標。贗角IC聲明由第三個原子前面的一個*表示,其他三個原子與之結合,如12*34所示。 IC語句中的原子順序與IMPR語句不同,提供長度1-3、角度1-3-2、二面角1-2-3-4、角度2-3-4和長度3-4。

image.png
上面提到,對於鏈中的第一個或最後一個殘基需要特殊處理,並且這是作為patch實現的。以下是蛋白質的默認第一個殘基patch,NTER。該語法與正常殘基幾乎相同,但是原子聲明可以指添加新的原子(HT1、HT2、HT3),或者修改給定名稱的現有原子(N,CA,HA)的類型和電荷。 DELETE聲明的操作與預期的一樣,刪除原子(HN)和包含它的鍵。

image.png

註釋“use in generate statement”表示在生成片段期間使用了NTER的patch,並在生成角度和二面角之前應用。其他類型的patch的例子是LINK的patch,即在片段生成之後應用的patch,如下所示。在這種情況下,patch語句需要兩個殘基作為參數,第一個殘基是沒有CTERpatch的片段的對後一個,第二個殘基是不帶NTER的patch的片段的第一個殘基(註釋將N和C末端顛倒)。原子名稱前面的數字1和2表示命名原子所屬的參數。因為角度和二面角沒有生成,所以它們被枚舉。

image.png

這些類型的patch被用來改變質子化狀態(ASPP,GLUP,HS2),產生二硫鍵(DISU),連接血紅素基團(PHEM)及其配體(PLO2,PLIG),甚至去除不需要的自生角(FHEM)。

以下是甘氨酸的完整殘基定義,甘氨酸是最小的氨基酸。將GLY與上述的ALA殘基進行比較。

image.png

不像ALA和大多数蛋白质残基,其中CA与HA和CB结合,在GLY中,它与一对氢分子HA1和HA2结合。另外,与N结合的氢称为H,而不是HN。由于这些原因,默认的NTERpatch不能应用于GLY,PATCHING语句用于将GLY的默认第一个残基patch更改为GLYP。类似地,上面的LINKpatch不能用于GLY残基,因此提供额外的补丁LIG1、LIG2和LIG3来链接GLY到非GLY、非GLY到GLY和GLY到GLY。
水也被定义为残基,如下所示,但使用时需要小心。第三个键,NAMD不需要,是允许CHARMM使水分子成为刚性体。这种环结构会混淆自动生成的角度和二面角,因此水分子片段必须在禁用自动生成角和二面角,因此还包括一个显式角。如果此第三个键已从水拓扑中移除,则仍必须禁用自动生成以避免复制角度,除非角度也已移除。
image.png

以下離子的殘基定義非常簡單

image.png

我們只討論了拓撲文件中與蛋白質和溶劑相關的部分。在拓撲的註釋中,有很多關於蛋白質的附加信息,更不用說脂類和核酸了。

其他文章補充:

需要注意的是,這裡定義的原子類型比周期表中給出的原子類型更具體。由於原子的行為因其所連接的原子而不同,因此質量項被用來定義同一原子的許多類型。例如,如果我們想給出丙烷中出現的不同原子類型,我們可以使用以下質量定義:

MASS 1 H 1.00800 H

MASS 2 CH2 12.0111 C

MASS 3 CH3 12.0111 C

這裡我們定義了兩種類型的碳:CH2碳和CH3碳,其本質區別在於附著在碳原子上的氫原子的數量不同。重要的是要記住,像CH2這樣的原子類型的定義並不能描述整個CH2基團(即亞甲基)。相反,它僅僅描述了那個基團的碳原子。另外,由於丙烷中的氫原子只與碳原子結合,我們只定義了一種氫原子。

MASS 2 CH2 12.0111 C ! carbon bonded to two hydrogen atoms

MASS 3 CH3 12.0111 C ! carbon bonded to three hydrogen atoms

在定義同一個atom的多個類型時,最好包含一個註釋來解釋每種類型之間的差異。 CHARMM註釋的行為與Python註釋相似,只是它們以感嘆號開頭。

GROUP

雖然CHARMM殘基的原子必須全部求和為整數,但這不一定是殘基中原子子集的情況。 GROUP關鍵字表示殘基中原子的子集,其電荷之和為整數。例如,乙烷殘基定義為兩組:

RESI ETHA 0.00

GROUP

ATOM CA CH3 -0.27

ATOM HA1 H 0.09

ATOM HA2 H 0.09

ATOM HA3 H 0.09

GROUP

ATOM CB CH3 -0.27

ATOM HB1 H 0.09

ATOM HB2 H 0.09

ATOM HB3 H 0.09

CHARMM並不總是要求原子以這種方式分組,而且有不止一種有效的方式來分配組。在上一個例子中,我們可以只給出一個包含所有8個乙烷原子的群,或者我們可以把所有的原子放在一個大的群中。在CHARMM中列出非鍵相互作用時,GROUP很重要,因為分組的方式決定了構建哪些非鍵列表。

Internal Coordinates
對於形成合適的二面角的任何四個原子(A、B、C和D),有五個值可用於確定所有四個原子相對於彼此的位置。這些值稱為內部坐標,在CHARMM中的格式如下:

IC A B C D Rab Tabc Pabcd Tbcd Rcd

這裡,IC A B C D表示包含原子A、B、C和D的適當的二面角,這樣A與B、B與C、C與D相連。 Rab表示原子A和B之間的鍵距,Tabc表示原子A、B和C之間的鍵角,Pabcd是所有四個原子形成的二面角。

贗角的格式類似,如下所示:

IC A B *C D Rab Tabc Pabcd Tbcd Rcd

在上面的例子中,C是其他三個原子所連接的中心原子。

如第5課所述,一個內部坐標表可以省略,稍後由CHARMM自動生成。在同一課的第6課中,我們提到IC表只能指定二面角。下面我們將展示兩個示例IC表條目來說明這一點:

IC HA1 CA CB HB1 0.00 0.00 120.00 0.00 0.00

IC HA1 CB *CA HA3 0.00 0.00 -120.00 0.00 0.00

以這種方式指定IC表條目時,必須使用自動角度以確保CHARMM知道自動生成鍵和角度

沒有留言:

張貼留言