生物信息學(xué)概論第七章蛋白質(zhì)和RNA結(jié)構(gòu)預(yù)測(cè)1ppt課件_第1頁(yè)
生物信息學(xué)概論第七章蛋白質(zhì)和RNA結(jié)構(gòu)預(yù)測(cè)1ppt課件_第2頁(yè)
生物信息學(xué)概論第七章蛋白質(zhì)和RNA結(jié)構(gòu)預(yù)測(cè)1ppt課件_第3頁(yè)
生物信息學(xué)概論第七章蛋白質(zhì)和RNA結(jié)構(gòu)預(yù)測(cè)1ppt課件_第4頁(yè)
生物信息學(xué)概論第七章蛋白質(zhì)和RNA結(jié)構(gòu)預(yù)測(cè)1ppt課件_第5頁(yè)
已閱讀5頁(yè),還剩76頁(yè)未讀, 繼續(xù)免費(fèi)閱讀

下載本文檔

版權(quán)說(shuō)明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請(qǐng)進(jìn)行舉報(bào)或認(rèn)領(lǐng)

文檔簡(jiǎn)介

1、Company LOGO第七章第七章 蛋白質(zhì)和蛋白質(zhì)和RNA結(jié)構(gòu)預(yù)測(cè)結(jié)構(gòu)預(yù)測(cè)生命科學(xué)與技術(shù)學(xué)院生命科學(xué)與技術(shù)學(xué)院閻閻 愛(ài)愛(ài) 俠俠COMPANYLOGO蛋白質(zhì)是重要物質(zhì)基礎(chǔ)蛋白質(zhì)是重要物質(zhì)基礎(chǔ)v人體的所有組織器官都會(huì)有蛋白質(zhì),蛋白質(zhì)是生人體的所有組織器官都會(huì)有蛋白質(zhì),蛋白質(zhì)是生命的物質(zhì)基礎(chǔ)。蛋白質(zhì)是人體的主要命的物質(zhì)基礎(chǔ)。蛋白質(zhì)是人體的主要“建筑材料建筑材料”。沒(méi)有蛋白質(zhì)的供給,人就不可能從。沒(méi)有蛋白質(zhì)的供給,人就不可能從34千克千克的新生兒長(zhǎng)成的新生兒長(zhǎng)成5060千克重的成年人。千克重的成年人。v一般說(shuō),蛋白質(zhì)約占人體全部質(zhì)量的一般說(shuō),蛋白質(zhì)約占人體全部質(zhì)量的18,最重,最重要的還是其與生命現(xiàn)

2、象有關(guān)。蛋白質(zhì)和核酸是生要的還是其與生命現(xiàn)象有關(guān)。蛋白質(zhì)和核酸是生命存在的主要形式。命存在的主要形式。 COMPANYLOGO面對(duì)堆積如山的生物學(xué)數(shù)據(jù)COMPANYLOGOCOMPANYLOGO蛋白質(zhì)的功能蛋白質(zhì)的功能蛋白質(zhì)是調(diào)控和實(shí)現(xiàn)所有生物功能的分子機(jī)器。蛋白質(zhì)是調(diào)控和實(shí)現(xiàn)所有生物功能的分子機(jī)器。例如:例如: 結(jié)構(gòu)蛋白結(jié)構(gòu)蛋白-膠原酶膠原酶-維持和增強(qiáng)結(jié)締組織維持和增強(qiáng)結(jié)締組織 機(jī)械酶機(jī)械酶-肌漿球蛋白肌漿球蛋白-實(shí)現(xiàn)宏觀和微觀上的運(yùn)動(dòng)實(shí)現(xiàn)宏觀和微觀上的運(yùn)動(dòng) 各種酶各種酶-參與生理功能參與生理功能 某些蛋白質(zhì)與某些蛋白質(zhì)與DNA或或RNA相互作用產(chǎn)生新的蛋相互作用產(chǎn)生新的蛋白質(zhì)白質(zhì)COMP

3、ANYLOGO蛋白質(zhì)折疊蛋白質(zhì)折疊 蛋白質(zhì)是線性的氨基酸合成的結(jié)果,但在生物蛋白質(zhì)是線性的氨基酸合成的結(jié)果,但在生物體內(nèi)會(huì)迅速折疊成一個(gè)緊密的球狀結(jié)構(gòu)。體內(nèi)會(huì)迅速折疊成一個(gè)緊密的球狀結(jié)構(gòu)。1.大多數(shù)蛋白質(zhì)只有在折疊成天然球狀結(jié)構(gòu)的時(shí)大多數(shù)蛋白質(zhì)只有在折疊成天然球狀結(jié)構(gòu)的時(shí)候才能具有完全的生物活性。候才能具有完全的生物活性。2.去折疊變性蛋白質(zhì)在允許重新折疊的實(shí)驗(yàn)去折疊變性蛋白質(zhì)在允許重新折疊的實(shí)驗(yàn)條件下可以折疊到原來(lái)的結(jié)構(gòu)。條件下可以折疊到原來(lái)的結(jié)構(gòu)。COMPANYLOGO重大挑戰(zhàn)性問(wèn)題重大挑戰(zhàn)性問(wèn)題 蛋白質(zhì)的結(jié)構(gòu)預(yù)測(cè)!蛋白質(zhì)的結(jié)構(gòu)預(yù)測(cè)?。壳?,還沒(méi)有一個(gè)算法(目前,還沒(méi)有一個(gè)算法能夠很好地預(yù)

4、測(cè)出一個(gè)蛋能夠很好地預(yù)測(cè)出一個(gè)蛋白的三維結(jié)構(gòu)形狀)白的三維結(jié)構(gòu)形狀)COMPANYLOGO蛋白質(zhì)結(jié)構(gòu)預(yù)測(cè)蛋白質(zhì)結(jié)構(gòu)預(yù)測(cè) 通過(guò)計(jì)算如分子力學(xué)、分子動(dòng)力學(xué)等來(lái)進(jìn)行結(jié)通過(guò)計(jì)算如分子力學(xué)、分子動(dòng)力學(xué)等來(lái)進(jìn)行結(jié)構(gòu)預(yù)測(cè)構(gòu)預(yù)測(cè)(1對(duì)于天然蛋白結(jié)構(gòu)和未折疊結(jié)構(gòu),兩者之間對(duì)于天然蛋白結(jié)構(gòu)和未折疊結(jié)構(gòu),兩者之間的能量差非常小的能量差非常小1kcal/mol 數(shù)量級(jí))數(shù)量級(jí))(2研究蛋白質(zhì)結(jié)構(gòu)的計(jì)算量非常大研究蛋白質(zhì)結(jié)構(gòu)的計(jì)算量非常大 COMPANYLOGO7.1 氨基酸氨基酸蛋白質(zhì)由20種不同大小、形狀和化學(xué)特性的氨基酸組成。氨基酸結(jié)構(gòu):COMPANYLOGO蛋白質(zhì)是由二十種不同的氨基酸構(gòu)成的蛋白質(zhì)是由二十種不同

5、的氨基酸構(gòu)成的 20種標(biāo)準(zhǔn)氨基酸都是種標(biāo)準(zhǔn)氨基酸都是L-氨基酸氨基酸特征:特征:L-氨基酸分子中的氨基酸分子中的碳分子中第碳分子中第2個(gè)個(gè)碳結(jié)合著一個(gè)堿性的氨基和一個(gè)酸性的羧基,碳結(jié)合著一個(gè)堿性的氨基和一個(gè)酸性的羧基,此外此外C還結(jié)合著一個(gè)還結(jié)合著一個(gè)H原子和一個(gè)側(cè)鏈基團(tuán)原子和一個(gè)側(cè)鏈基團(tuán)用用R表示)。表示)。 每一種氨基酸的每一種氨基酸的R都是不同的,側(cè)鏈上的都是不同的,側(cè)鏈上的碳依次是第碳依次是第3、4、5和和6位碳。位碳。COMPANYLOGOA.疏水氨基酸hydrophobic amino acid)B.極性氨基酸polar amino acid)C.帶電氨基酸charged amin

6、o acid)氨基酸通常按性質(zhì)被分為氨基酸通常按性質(zhì)被分為3類類COMPANYLOGOCompany Logo疏水性氨基酸疏水性氨基酸 這類氨基酸的側(cè)鏈大多或者全部由碳原子和氫原子組成,因此這些氨基酸就不太可能與水分子形成氫鍵。如:酪氨酸、色氨酸、苯丙氨酸等。酪氨酸酪氨酸苯丙氨酸苯丙氨酸色氨酸色氨酸COMPANYLOGOCompany Logo極性氨基酸極性氨基酸 這類氨基酸的側(cè)鏈通常由氧原子和/或氮原子組成,它們比較容易與水分子形成氫鍵。如甘氨酸、半胱氨酸、酪氨酸等。甘氨酸甘氨酸半胱氨酸半胱氨酸酪氨酸酪氨酸COMPANYLOGOpH值表示溶液中值表示溶液中H+濃度的負(fù)對(duì)數(shù)。濃度的負(fù)對(duì)數(shù)。55

7、,000,000個(gè)水分子中有一個(gè)水分子離解成個(gè)水分子中有一個(gè)水分子離解成H+和和OH-,與之相對(duì)應(yīng)的濃度是,與之相對(duì)應(yīng)的濃度是110-7M,因此中性溶,因此中性溶液的液的pH=7。生理?xiàng)l件生理?xiàng)l件pH7附近下氨基酸呈現(xiàn)兼性離子形式附近下氨基酸呈現(xiàn)兼性離子形式pHCOMPANYLOGO 和水分子相似,許多氨基酸的側(cè)鏈也含有可離和水分子相似,許多氨基酸的側(cè)鏈也含有可離解的質(zhì)子。氨基酸的解的質(zhì)子。氨基酸的pKa值是一個(gè)表示氨基酸釋放值是一個(gè)表示氨基酸釋放其可離解質(zhì)子的相對(duì)難易程度的量。其可離解質(zhì)子的相對(duì)難易程度的量。 當(dāng)當(dāng)pH值比氨基酸的值比氨基酸的pKa值小一個(gè)值小一個(gè)pH單位時(shí),單位時(shí),大約會(huì)有

8、大約會(huì)有90%的氨基酸被質(zhì)子化;當(dāng)?shù)陌被岜毁|(zhì)子化;當(dāng)pH值比氨基酸值比氨基酸的的pKa值小兩個(gè)值小兩個(gè)pH單位時(shí),大約會(huì)有單位時(shí),大約會(huì)有99%的氨基酸的氨基酸被質(zhì)子化。被質(zhì)子化。pKaCOMPANYLOGOH2NCRCOO -H+H3NCRCOO -H+H3NCRCOOHHKa1Ka2+ H + H +兼性離子(Ao)陽(yáng)離子(A+)陰離子(A-)+ O H -+ O H -pKaCOMPANYLOGOA0H+A+Ka1A0A -Ka2H+pKaCOMPANYLOGOv利用Handerson-Hasselalch公式,可算出在任一pH條件下一種氨基酸的各種離子的比例:v 質(zhì)子受體vpH =

9、pKa + log -v 質(zhì)子供體COMPANYLOGOv蛋白質(zhì)的等電點(diǎn)是指當(dāng)這種蛋白質(zhì)在溶液中的靜蛋白質(zhì)的等電點(diǎn)是指當(dāng)這種蛋白質(zhì)在溶液中的靜電荷為零時(shí)溶液的電荷為零時(shí)溶液的pHpH值。蛋白質(zhì)的等電點(diǎn)可以反值。蛋白質(zhì)的等電點(diǎn)可以反映組成這種蛋白質(zhì)的氨基酸的總體信息。例如如映組成這種蛋白質(zhì)的氨基酸的總體信息。例如如果蛋白質(zhì)的果蛋白質(zhì)的pIpI7 7,我們就可以知道蛋白質(zhì)中的堿,我們就可以知道蛋白質(zhì)中的堿性氨基酸比酸性氨基酸多。性氨基酸比酸性氨基酸多。對(duì)對(duì)R側(cè)鏈基不解離的氨基酸:側(cè)鏈基不解離的氨基酸:pI = (pKa1+pKa2)/2pICOMPANYLOGOA+=A0pKa1=2.34A0=A

10、-pKa2=9.60pI=5.970OH- mol數(shù)H+mol數(shù)pH02468101214甘氨酸的滴定曲線(解離曲線)甘氨酸滴定曲線甘氨酸滴定曲線COMPANYLOGO 幾種氨基酸的解離常數(shù)和等電點(diǎn)幾種氨基酸的解離常數(shù)和等電點(diǎn)氨基酸氨基酸-COOH pKa-N +H 3 pKaR基基pKapI甘氨酸甘氨酸2.349.60 5.97丙氨酸丙氨酸2.349.69 6.02天冬氨酸天冬氨酸2.099.823.86(COOH)2.97天冬酰胺天冬酰胺2.028.8 5.41精氨酸精氨酸2.179.0412.48(胍基胍基)10.76組氨酸組氨酸1.829.16.00咪唑)咪唑)7.59COMPANYL

11、OGO7.2 多肽的組成一級(jí)結(jié)構(gòu))多肽的組成一級(jí)結(jié)構(gòu)) 幾個(gè)氨基酸組成的氨基酸鏈稱作肽,一條較長(zhǎng)的氨基酸鏈通常稱為多肽或者蛋白質(zhì)。當(dāng)兩個(gè)氨基酸實(shí)現(xiàn)共價(jià)結(jié)合的時(shí)候,一個(gè)氨基酸的氨基丟失一個(gè)氫,同時(shí)另一個(gè)氨基酸丟失一個(gè)氧和一個(gè)氫,脫水生成肽鍵。COMPANYLOGO7.2 多肽的組成一級(jí)結(jié)構(gòu))多肽的組成一級(jí)結(jié)構(gòu)) 與DNA 分子和 RNA 分子一樣,多肽也具有特定的方向性。多肽的氨基端N端具有一個(gè)氨基,同時(shí)在羧基端C端具有一個(gè)羧基。 蛋白質(zhì)序列通常被認(rèn)為是從N端起始,然后逐漸向C端發(fā)展的。 組成蛋白質(zhì)的氨基酸序列完全決定了蛋白質(zhì)的三維形狀和理化特性,也最終決定了它的生物功能。COMPANYLOGO

12、7.3 二級(jí)結(jié)構(gòu)二級(jí)結(jié)構(gòu) 作用 估計(jì)蛋白的結(jié)構(gòu)類型 提高同源模建的準(zhǔn)確性 三級(jí)結(jié)構(gòu)預(yù)測(cè)的起點(diǎn)方法 Chou-Fasman經(jīng)驗(yàn)參數(shù)法) GarnierGOR法)COMPANYLOGO二級(jí)結(jié)構(gòu)二級(jí)結(jié)構(gòu) COMPANYLOGO7.3 二級(jí)結(jié)構(gòu)的類型二級(jí)結(jié)構(gòu)的類型(1) 螺旋:螺旋: 肽鏈主鏈繞假想的中肽鏈主鏈繞假想的中心軸盤繞成螺旋狀,一心軸盤繞成螺旋狀,一般都是右手螺旋結(jié)構(gòu),般都是右手螺旋結(jié)構(gòu),螺旋是靠鏈內(nèi)氫鍵維持螺旋是靠鏈內(nèi)氫鍵維持的。每個(gè)氨基酸殘基的。每個(gè)氨基酸殘基第第n個(gè)的羰基與多肽個(gè)的羰基與多肽鏈鏈 C 端方向的第端方向的第4個(gè)殘個(gè)殘基第基第4+n個(gè)的酰胺個(gè)的酰胺氮形成氫鍵。氮形成氫鍵。C

13、OMPANYLOGO7.3 二級(jí)結(jié)構(gòu)的類型二級(jí)結(jié)構(gòu)的類型(2折疊:折疊: 肽鍵平面折疊成鋸肽鍵平面折疊成鋸齒狀齒狀, 相鄰肽鏈主鏈相鄰肽鏈主鏈的的N-H 和和 C=O 之間之間形成有規(guī)則的氫鍵形成有規(guī)則的氫鍵, 在在-折疊中折疊中, 所有的所有的肽鍵都參與鏈間氫鍵肽鍵都參與鏈間氫鍵的形成的形成, 氫鍵與氫鍵與-折折疊的長(zhǎng)軸呈垂直關(guān)系疊的長(zhǎng)軸呈垂直關(guān)系.COMPANYLOGO7.3 二級(jí)結(jié)構(gòu)的類型二級(jí)結(jié)構(gòu)的類型(3轉(zhuǎn)角:轉(zhuǎn)角: 蛋白質(zhì)二級(jí)結(jié)構(gòu)蛋白質(zhì)二級(jí)結(jié)構(gòu)類型之一,由類型之一,由4個(gè)氨個(gè)氨基酸殘基組成,其中基酸殘基組成,其中第一個(gè)殘基的第一個(gè)殘基的 CO 基基團(tuán)和第四個(gè)殘基的團(tuán)和第四個(gè)殘基的 N

14、H基團(tuán)之間形成氫鍵基團(tuán)之間形成氫鍵,使多肽鏈的方向發(fā),使多肽鏈的方向發(fā)生生“U形改變。形改變。 COMPANYLOGO 有些蛋白質(zhì)中含有大量的螺旋 如血紅蛋白和肌紅蛋白 而一些蛋白質(zhì)中則不含或者僅含很少的 螺旋 如鐵氧蛋白 有些蛋白質(zhì)的二級(jí)結(jié)構(gòu)以折疊為主 如免疫球蛋白 例:肽鏈Ala(A)-Glu(E)-Leu(L)-Met(M) 傾向于形成螺旋 肽鏈Pro(P)-Gly(G)-Tyr(Y)-Ser(S)則不會(huì)形成螺旋 COMPANYLOGO7.3.1 骨架柔性骨架柔性 多肽鏈中氨基酸的非側(cè)鏈原子構(gòu)成了蛋白骨架。骨架中共價(jià)鍵的鍵長(zhǎng)和平面鍵角或多或少都是固定的。只有兩個(gè)鍵可以旋轉(zhuǎn):(1) 氨基氮

15、原子和碳原子之間形成的鍵的旋轉(zhuǎn)角 (); (2)碳原子和羧基碳原子之間形成的鍵的旋轉(zhuǎn)角 ();COMPANYLOGO旋轉(zhuǎn)角旋轉(zhuǎn)角phi (N-C) psi (C C羥基)羥基)) COMPANYLOGOCompany Logo 一個(gè)蛋白質(zhì)的構(gòu)象可以通過(guò)每個(gè)氨基酸的和角來(lái)表示,但是物理上并不能確實(shí)觀察到所有的和角,因?yàn)橐恍┖徒堑慕M合可能導(dǎo)致骨架上相鄰殘基側(cè)鏈原子的空間碰撞。Ramachandran圖顯示了除甘氨酸殘基外的其他氨基酸殘基中允許出現(xiàn)的和值。Ramachandran圖圖甘氨酸沒(méi)有側(cè)鏈,因此甘氨酸殘基允許出現(xiàn)的和值的范圍比其他氨基酸殘基都要大。COMPANYLOGOCompany Log

16、o 預(yù)測(cè)二級(jí)結(jié)構(gòu)的算法中使用了多種計(jì)算方法如神經(jīng)網(wǎng)絡(luò)、離散態(tài)模型、隱馬爾科夫模型、最近鄰分類和進(jìn)化計(jì)算等。 目前大多數(shù)二級(jí)結(jié)構(gòu)預(yù)測(cè)的算法都是對(duì)一系列由BLAST、FASTA和CLUSTALW算法產(chǎn)生的經(jīng)過(guò)比對(duì)的序列進(jìn)行二級(jí)結(jié)構(gòu)預(yù)測(cè)。 現(xiàn)在的二級(jí)結(jié)構(gòu)預(yù)測(cè)算法,如 PHD 和 Predator,將蛋白序列和每個(gè)氨基酸的相對(duì)保守程度作為輸入,預(yù)測(cè)準(zhǔn)確率能達(dá)到70%-75%。7.3.2 預(yù)測(cè)的準(zhǔn)確度預(yù)測(cè)的準(zhǔn)確度COMPANYLOGOv每種氨基酸出現(xiàn)在各種二級(jí)結(jié)構(gòu)中傾向或者頻率是每種氨基酸出現(xiàn)在各種二級(jí)結(jié)構(gòu)中傾向或者頻率是不同的不同的v例如:例如:Glu 主要出現(xiàn)在主要出現(xiàn)在螺旋中螺旋中v Asp 和和

17、 Gly 主要分布在轉(zhuǎn)角中主要分布在轉(zhuǎn)角中v Pro 也常出現(xiàn)在轉(zhuǎn)角中,但是絕不會(huì)出現(xiàn)也常出現(xiàn)在轉(zhuǎn)角中,但是絕不會(huì)出現(xiàn)在在螺旋中螺旋中v所以可以根據(jù)每種氨基酸殘基形成二級(jí)結(jié)構(gòu)的傾向所以可以根據(jù)每種氨基酸殘基形成二級(jí)結(jié)構(gòu)的傾向性性Chou-Fasman或者統(tǒng)計(jì)規(guī)律或者統(tǒng)計(jì)規(guī)律GOR進(jìn)進(jìn)行二級(jí)結(jié)構(gòu)預(yù)測(cè)行二級(jí)結(jié)構(gòu)預(yù)測(cè)蛋白質(zhì)二級(jí)結(jié)構(gòu)預(yù)測(cè)方法蛋白質(zhì)二級(jí)結(jié)構(gòu)預(yù)測(cè)方法COMPANYLOGO該方法由 Chou 和 Fasman 在 70年代提出來(lái),是一種基于單個(gè)氨基酸殘基統(tǒng)計(jì)的經(jīng)驗(yàn)預(yù)測(cè)方法。通過(guò)統(tǒng)計(jì)分析,獲得的每個(gè)殘基出現(xiàn)于特定二級(jí)結(jié)構(gòu)構(gòu)象的傾向性因子,進(jìn)而利用這些傾向性因子預(yù)測(cè)蛋白質(zhì)的二級(jí)結(jié)構(gòu).每個(gè)氨基酸都

18、有幾個(gè)構(gòu)成參數(shù),P(a),P(b) 和 P(turn), 分別表示相應(yīng)的氨基酸形成螺旋、折疊和轉(zhuǎn)角的偏向性。另外,每個(gè)氨基酸同時(shí)也有4個(gè)轉(zhuǎn)角參數(shù)f(i), f(i+1), f(i+2), f(i+3), 分別對(duì)應(yīng)于這種氨基酸出現(xiàn)在發(fā)夾轉(zhuǎn)角第一、第二、第三和第四位的頻率。Chou-Fasman法法COMPANYLOGOCOMPANYLOGO(1) 尋找所有相鄰的6個(gè)殘基中至少4個(gè)殘基的 P(a) 100的區(qū)域。(2) 對(duì)于 (1) 中發(fā)現(xiàn)的每一個(gè)區(qū)域,從區(qū)域兩端向外延伸,直至出現(xiàn) 4 個(gè)連續(xù)殘基的P (a) 5,并且區(qū)域的P(a) P(b),那么這樣的一個(gè)區(qū)域就被預(yù)測(cè)為螺旋。螺旋的預(yù)測(cè)規(guī)則螺旋的

19、預(yù)測(cè)規(guī)則COMPANYLOGO折疊的預(yù)測(cè)規(guī)則折疊的預(yù)測(cè)規(guī)則(1) 尋找所有相鄰的尋找所有相鄰的6個(gè)殘基中至少個(gè)殘基中至少4個(gè)殘基的個(gè)殘基的P(b) 100的的區(qū)域。區(qū)域。(2) 對(duì)于對(duì)于(1) 中發(fā)現(xiàn)的每一個(gè)區(qū)域,從區(qū)域兩端向外延伸,中發(fā)現(xiàn)的每一個(gè)區(qū)域,從區(qū)域兩端向外延伸,一旦所有的區(qū)域延伸結(jié)束后,當(dāng)一個(gè)區(qū)域中所有殘基的一旦所有的區(qū)域延伸結(jié)束后,當(dāng)一個(gè)區(qū)域中所有殘基的P(b)的均值大于的均值大于100 并且并且P(b) P(a) 時(shí),這個(gè)區(qū)域就預(yù)時(shí),這個(gè)區(qū)域就預(yù)測(cè)為測(cè)為折疊。折疊。假如預(yù)測(cè)出的螺旋區(qū)域與預(yù)測(cè)出的折疊區(qū)域有重疊的話假如預(yù)測(cè)出的螺旋區(qū)域與預(yù)測(cè)出的折疊區(qū)域有重疊的話,那么如果重疊區(qū)域

20、的,那么如果重疊區(qū)域的P(b) P(a),就預(yù)測(cè)為,就預(yù)測(cè)為折疊;反之,則預(yù)測(cè)為折疊;反之,則預(yù)測(cè)為螺旋。螺旋。COMPANYLOGO(1對(duì)于每個(gè)位于i位置上的殘基計(jì)算它的轉(zhuǎn)角偏向性P(t)。計(jì)算方法如下: P(t) = 第i位上的殘基的 f(i) 值 第 i+1位上的殘基的 f(i+1)值 第i+2位上的殘基的 f(i+2) 值第 i+3 位上的殘基的 f(i+3)值(2若一段區(qū)域內(nèi)的氨基酸滿足如下條件,就預(yù)測(cè)這段區(qū)域是一個(gè)從第i位氨基酸開(kāi)始的發(fā)夾轉(zhuǎn)角。 a. P(t) 0.000075; b. 從第i位到第i+3位的4個(gè)殘基的P(turn)參數(shù)的平均值100; c. 從第i位到第i+3位的

21、4個(gè)殘基的P(turn) P(a),且 P(turn) P(b);轉(zhuǎn)角的預(yù)測(cè)規(guī)則轉(zhuǎn)角的預(yù)測(cè)規(guī)則COMPANYLOGO 是一種基于信息論和貝葉斯統(tǒng)計(jì)學(xué)的方法。是一種基于信息論和貝葉斯統(tǒng)計(jì)學(xué)的方法。 GOR將蛋白質(zhì)序列當(dāng)作一連串的信息值來(lái)處理。將蛋白質(zhì)序列當(dāng)作一連串的信息值來(lái)處理。 GOR方法不僅考慮被預(yù)測(cè)位置本身氨基酸殘基種類方法不僅考慮被預(yù)測(cè)位置本身氨基酸殘基種類的影響,而且考慮相鄰殘基種類對(duì)該位置構(gòu)象的影的影響,而且考慮相鄰殘基種類對(duì)該位置構(gòu)象的影響。響。GOR方法方法COMPANYLOGOGOR方法將序列中的每一個(gè)殘基與和它方法將序列中的每一個(gè)殘基與和它N端緊鄰的端緊鄰的8個(gè)殘基以及和它個(gè)

22、殘基以及和它 C 端緊鄰的端緊鄰的 8個(gè)殘基一起考慮,個(gè)殘基一起考慮,通過(guò)對(duì)已知的二級(jí)結(jié)構(gòu)的蛋白樣本的分析,計(jì)算出通過(guò)對(duì)已知的二級(jí)結(jié)構(gòu)的蛋白樣本的分析,計(jì)算出中心殘基的二級(jí)結(jié)構(gòu)分別為螺旋、折疊和轉(zhuǎn)角時(shí)每中心殘基的二級(jí)結(jié)構(gòu)分別為螺旋、折疊和轉(zhuǎn)角時(shí)每種氨基酸出現(xiàn)在窗口中各個(gè)位置的頻率,產(chǎn)生一個(gè)種氨基酸出現(xiàn)在窗口中各個(gè)位置的頻率,產(chǎn)生一個(gè) 1720 的得分矩陣。然后預(yù)測(cè)序列中每個(gè)殘基形的得分矩陣。然后預(yù)測(cè)序列中每個(gè)殘基形成這些二級(jí)結(jié)構(gòu)的概率。成這些二級(jí)結(jié)構(gòu)的概率。GOR 方法的預(yù)測(cè)準(zhǔn)確率約為方法的預(yù)測(cè)準(zhǔn)確率約為 65%。GOR方法方法COMPANYLOGO序列窗口序列窗口 中心殘基中心殘基GOR方法

23、考慮窗口中各個(gè)殘基對(duì)中心殘基二級(jí)結(jié)構(gòu)的方法考慮窗口中各個(gè)殘基對(duì)中心殘基二級(jí)結(jié)構(gòu)的支持程度支持程度COMPANYLOGO(1三級(jí)結(jié)構(gòu) 一個(gè)折疊的多肽鏈的整體三維形狀稱為蛋白質(zhì)的三級(jí)結(jié)構(gòu)。7.4 三級(jí)結(jié)構(gòu)和四級(jí)結(jié)構(gòu)三級(jí)結(jié)構(gòu)和四級(jí)結(jié)構(gòu)COMPANYLOGO(2四級(jí)結(jié)構(gòu) 幾個(gè)多肽相互作用形成一個(gè)功能蛋白質(zhì),多酶復(fù)合物中也會(huì)出現(xiàn)蛋白質(zhì)與蛋白質(zhì)的相互作用,這種分子間相互作用稱為蛋白質(zhì)的四級(jí)結(jié)構(gòu)。7.4 三級(jí)結(jié)構(gòu)和四級(jí)結(jié)構(gòu)三級(jí)結(jié)構(gòu)和四級(jí)結(jié)構(gòu)COMPANYLOGO(1) 理論分析方法通過(guò)理論計(jì)算如分子力學(xué)、分子動(dòng)力學(xué)計(jì)算進(jìn)行結(jié)構(gòu)預(yù)測(cè)。(2)統(tǒng)計(jì)的方法 對(duì)已知結(jié)構(gòu)的蛋白質(zhì)進(jìn)行統(tǒng)計(jì)分析,建立序列到結(jié)構(gòu)的映射模型,

24、進(jìn)而對(duì)未知結(jié)構(gòu)的蛋白質(zhì)根據(jù)映射模型直接從氨基酸序列預(yù)測(cè)結(jié)構(gòu)。 包括:經(jīng)驗(yàn)性方法結(jié)構(gòu)規(guī)律提取方法同源模型化方法7.4 三級(jí)結(jié)構(gòu)和四級(jí)結(jié)構(gòu)預(yù)測(cè)方法三級(jí)結(jié)構(gòu)和四級(jí)結(jié)構(gòu)預(yù)測(cè)方法COMPANYLOGO影響三、四級(jí)結(jié)構(gòu)的幾類作用力:影響三、四級(jí)結(jié)構(gòu)的幾類作用力:(1疏水性疏水性 疏水作用力通常被認(rèn)為是蛋白質(zhì)折疊成一個(gè)緊密球狀結(jié)疏水作用力通常被認(rèn)為是蛋白質(zhì)折疊成一個(gè)緊密球狀結(jié)構(gòu)的幾種基礎(chǔ)力之一。構(gòu)的幾種基礎(chǔ)力之一。 大多數(shù)蛋白質(zhì)的天然結(jié)構(gòu)都有一個(gè)疏水核心和一個(gè)與溶大多數(shù)蛋白質(zhì)的天然結(jié)構(gòu)都有一個(gè)疏水核心和一個(gè)與溶液相接觸的表面,疏水核心中掩藏了疏水殘基,使得它們液相接觸的表面,疏水核心中掩藏了疏水殘基,使得它

25、們與溶液相隔離,而與溶液相接觸的表面大多或者全部由極與溶液相隔離,而與溶液相接觸的表面大多或者全部由極性殘基和帶電殘基組成。性殘基和帶電殘基組成。 鐮刀形細(xì)胞貧血癥正是由于鐮刀形細(xì)胞貧血癥正是由于球蛋白表面的單個(gè)殘基由帶球蛋白表面的單個(gè)殘基由帶電的谷氨酸突變到疏水的纈氨酸,就導(dǎo)致了細(xì)胞形態(tài)的徹電的谷氨酸突變到疏水的纈氨酸,就導(dǎo)致了細(xì)胞形態(tài)的徹底變化,最終使人產(chǎn)生貧血、勞累甚至是壞疽的嚴(yán)重病癥底變化,最終使人產(chǎn)生貧血、勞累甚至是壞疽的嚴(yán)重病癥。COMPANYLOGO(2二硫鍵二硫鍵 當(dāng)兩個(gè)半胱氨酸殘基中的巰基相互靠近時(shí),它們可以被當(dāng)兩個(gè)半胱氨酸殘基中的巰基相互靠近時(shí),它們可以被氧化而產(chǎn)生共價(jià)的二

26、硫鍵,從而將在蛋白質(zhì)一級(jí)結(jié)構(gòu)中可氧化而產(chǎn)生共價(jià)的二硫鍵,從而將在蛋白質(zhì)一級(jí)結(jié)構(gòu)中可能相距很遠(yuǎn)的殘基交叉連接起來(lái)。能相距很遠(yuǎn)的殘基交叉連接起來(lái)。 二硫鍵是蛋白質(zhì)中唯一非骨架原子的共價(jià)交聯(lián)結(jié)合,它二硫鍵是蛋白質(zhì)中唯一非骨架原子的共價(jià)交聯(lián)結(jié)合,它們對(duì)穩(wěn)定蛋白質(zhì)的折疊起著非常明顯的作用。們對(duì)穩(wěn)定蛋白質(zhì)的折疊起著非常明顯的作用。 影響三、四級(jí)結(jié)構(gòu)的幾類作用力:影響三、四級(jí)結(jié)構(gòu)的幾類作用力:COMPANYLOGO(3活性結(jié)構(gòu)與最穩(wěn)定結(jié)構(gòu)活性結(jié)構(gòu)與最穩(wěn)定結(jié)構(gòu) 由于蛋白質(zhì)折疊過(guò)程中的自由度非常大,因此一般不可由于蛋白質(zhì)折疊過(guò)程中的自由度非常大,因此一般不可能評(píng)價(jià)蛋白質(zhì)的天然狀態(tài)是不是實(shí)際中最穩(wěn)定能量最優(yōu)能評(píng)價(jià)

27、蛋白質(zhì)的天然狀態(tài)是不是實(shí)際中最穩(wěn)定能量最優(yōu)的構(gòu)象。但是,自然選擇很明顯會(huì)選擇既有活性又有穩(wěn)的構(gòu)象。但是,自然選擇很明顯會(huì)選擇既有活性又有穩(wěn)定性的蛋白質(zhì)。定性的蛋白質(zhì)。 如果蛋白質(zhì)一級(jí)結(jié)構(gòu)中的突變降低了蛋白質(zhì)的穩(wěn)定性,如果蛋白質(zhì)一級(jí)結(jié)構(gòu)中的突變降低了蛋白質(zhì)的穩(wěn)定性,在進(jìn)化中就會(huì)產(chǎn)生不利因素,那么在選擇的時(shí)候這些突變?cè)谶M(jìn)化中就會(huì)產(chǎn)生不利因素,那么在選擇的時(shí)候這些突變體就會(huì)被剔除。體就會(huì)被剔除。 影響三、四級(jí)結(jié)構(gòu)的幾類作用力:影響三、四級(jí)結(jié)構(gòu)的幾類作用力:COMPANYLOGOLevinthal悖論悖論 1968年,C. Levinthal 在他的一篇論文中指出,即使一個(gè)多肽鏈的長(zhǎng)度不長(zhǎng),它可能采取

28、的折疊方式也非常多。如果要對(duì)一個(gè)多肽的所有可能出現(xiàn)的構(gòu)象進(jìn)行隨機(jī)搜索,那么可能要花費(fèi)很多年的時(shí)間。這個(gè)發(fā)現(xiàn)被稱為L(zhǎng)evinthal悖論。 Levinthal 悖論認(rèn)為蛋白折疊的過(guò)程是從未折疊的狀態(tài)開(kāi)始,然后逐漸經(jīng)過(guò)一系列越來(lái)越穩(wěn)定的中間態(tài),最終折疊成蛋白質(zhì)的天然狀態(tài)。至于這樣的折疊途徑是否最終在構(gòu)象的能量處于全局最小點(diǎn)時(shí)結(jié)束,目前還有很多爭(zhēng)論。COMPANYLOGO7.5 蛋白質(zhì)折疊建模算法蛋白質(zhì)折疊建模算法(1) 網(wǎng)格模型網(wǎng)格模型(2) 去網(wǎng)格模型去網(wǎng)格模型(3) 能量函數(shù)和優(yōu)化能量函數(shù)和優(yōu)化COMPANYLOGO7.5.1 網(wǎng)格模型網(wǎng)格模型v H-P疏水-極性模型:v 該模型有三種簡(jiǎn)化:v

29、 (1蛋白質(zhì)中各個(gè)氨基酸殘基的碳原子都位于二維網(wǎng)格 v 或三維網(wǎng)格的格點(diǎn)上;v (2疏水作用是蛋白折疊中唯一的重要因素;v (3通過(guò)計(jì)算疏水殘基接觸的數(shù)目代替構(gòu)象的能量計(jì)算。v 雖然這樣的處理非常簡(jiǎn)單,但是通過(guò)H-P模型的計(jì)算分析,能夠發(fā)現(xiàn)蛋白質(zhì)折疊的一些機(jī)制。COMPANYLOGOH-P模型模型H-P模型是基于疏水殘基接觸來(lái)進(jìn)行打分的。除了多肽鏈中相鄰的疏水殘基之外,每一個(gè)相互靠近的疏水接觸對(duì)能量的貢獻(xiàn)都設(shè)為 -1,最優(yōu)的構(gòu)象就是所有可能的構(gòu)象中具有最多疏水接觸的那個(gè)構(gòu)象。上圖中二維和三維構(gòu)象的得分都是-3。黑色為疏水殘基,白色為極性殘基。N端為1號(hào)殘基,位于(0,0)處,下一個(gè)位于(1,0

30、) 處。COMPANYLOGO疏水拉鏈?zhǔn)杷?(hydrophobic zipper) 機(jī)制機(jī)制v K.Dill 提出了疏水拉鏈機(jī)制作為形成二級(jí)結(jié)構(gòu)的可能折疊機(jī)制。v 疏水拉鏈機(jī)制是指蛋白鏈上的疏水殘基表示為黑色圓圈由于疏水作用移到一起,從而使得極性殘基產(chǎn)生了一個(gè)環(huán)。當(dāng)這個(gè)過(guò)程不斷重復(fù),就形成了一個(gè)反平行折疊片。v P145:圖7.9COMPANYLOGO網(wǎng)格模型中的構(gòu)象表示方法網(wǎng)格模型中的構(gòu)象表示方法(1) 絕對(duì)方向表示法 (absolute direction representation) 將第一個(gè)殘基放在網(wǎng)格的(0,0)位置上,然后描述前面一個(gè)殘基到下一個(gè)殘基的移動(dòng)方向。二維模型中,

31、每一個(gè)位置上可選擇的方向包括上下左右四個(gè)方向,用 U、D、L、R表示。(R,R,D,L,D,L,U,L,U,U,R)COMPANYLOGO網(wǎng)格模型中的構(gòu)象表示方法網(wǎng)格模型中的構(gòu)象表示方法(1) 絕對(duì)方向表示法 (absolute direction representation) 三維模型中,每一個(gè)位置上可選擇的方向包括上下左右前后六個(gè)方向,分別用 U、D、L、R、F、B 表示。(R,B,U,F,L,U,R,B,L,L,F)COMPANYLOGO網(wǎng)格模型中的構(gòu)象表示方法網(wǎng)格模型中的構(gòu)象表示方法(2) 相對(duì)方向表示法:相對(duì)方向表示法: 將第一個(gè)殘基放在網(wǎng)格的將第一個(gè)殘基放在網(wǎng)格的(0,0)位置上

32、,然后利用每個(gè)位置上,然后利用每個(gè)殘基主鏈的轉(zhuǎn)動(dòng)方向來(lái)表示每個(gè)位置上的殘基的方向殘基主鏈的轉(zhuǎn)動(dòng)方向來(lái)表示每個(gè)位置上的殘基的方向。二維模型中,每一個(gè)位置上可選擇的方向包括左、。二維模型中,每一個(gè)位置上可選擇的方向包括左、右、前三個(gè)方向,用右、前三個(gè)方向,用 L、R、F 表示。表示。(F,F,R,R,L,R,R,L,R,F,R)COMPANYLOGO網(wǎng)格模型中的構(gòu)象表示方法網(wǎng)格模型中的構(gòu)象表示方法(2) 相對(duì)方向表示法:相對(duì)方向表示法: 三維模型中,每一個(gè)位置上可選擇的方向包括上、下、三維模型中,每一個(gè)位置上可選擇的方向包括上、下、左、右、前五個(gè)方向,分別用左、右、前五個(gè)方向,分別用 U、D、L、

33、R、F表示。表示。(F,L,U,U,R,U,U,L,L,F,L)COMPANYLOGO殘基碰撞問(wèn)題殘基碰撞問(wèn)題v 使用上述兩種方法表示時(shí),會(huì)遇到一個(gè)關(guān)鍵問(wèn)題,那就是一些構(gòu)象中兩個(gè)殘基會(huì)出現(xiàn)在同一個(gè)位置上。比如, 一個(gè)二維構(gòu)象用相對(duì)法表示法表示時(shí),如果它的起始前四個(gè)殘基是 (L,L,L,L),那么這個(gè)構(gòu)象就會(huì)有兩個(gè)殘基位于原點(diǎn)(0,0)上,從而導(dǎo)致殘基碰撞(bump),或原子空間碰撞。v 解決這個(gè)問(wèn)題的方法包括:v (1給每一個(gè)具有碰撞的構(gòu)象分配一個(gè)非常高的能量值,因而在搜索能量最低構(gòu)象時(shí)可以有效地去除這些碰撞的構(gòu)象。v (2優(yōu)先排序法,即每個(gè)殘基對(duì)應(yīng)的方向不唯一,比如, 在二維模型中,某一殘基

34、對(duì)應(yīng)的方向可能會(huì)是 L,F,R,表示這個(gè)殘基最可能對(duì)應(yīng)的方向?yàn)樽?,其次為前,再次為右。COMPANYLOGO7.5.2 去網(wǎng)格模型去網(wǎng)格模型v 如果在蛋白質(zhì)模型中取消氨基酸定位于網(wǎng)格點(diǎn)的限制,那么蛋白模型就可以更真實(shí)地模擬出蛋白的實(shí)際構(gòu)象。如果采取完整骨架模型,并將模型中的 phi 角和 psi 角的取值范圍定義為Ramachandran 圖中所用允許出現(xiàn)的phi 角和 psi 角的值,那么這種去網(wǎng)格折疊模型模擬出的小多肽的構(gòu)象與實(shí)驗(yàn)測(cè)出的真實(shí)構(gòu)象會(huì)非常接近。v v 去網(wǎng)格模型的誤差通常用預(yù)測(cè)構(gòu)象和實(shí)際構(gòu)象中碳原子的均方根偏差 (RMSD) 來(lái)計(jì)算。碳原子的RMSD是指當(dāng)預(yù)測(cè)構(gòu)象和實(shí)際構(gòu)象重疊

35、在一起時(shí),兩種構(gòu)象中每個(gè)碳原子位置的Euclidean平方距離的總和。COMPANYLOGO7.5.2 去網(wǎng)格模型去網(wǎng)格模型v 隨著蛋白模型與實(shí)際情況越來(lái)越相符,模型的復(fù)雜性也越來(lái)越大??梢灾豢紤]碳原子,也可以考慮所有的骨架原子,甚至所有的骨架原子和側(cè)鏈原子。側(cè)鏈也可以考慮剛性、半柔性和完全柔性。v 側(cè)鏈v 剛性側(cè)鏈:X-射線晶體結(jié)構(gòu)中每種氨基酸出現(xiàn)最多的構(gòu)象;v 半柔性側(cè)鏈:可以采用類似的經(jīng)驗(yàn)性方法得到; 從一系列 的X-射線晶體結(jié)構(gòu)得到側(cè)鏈的多種構(gòu)象,形狀類似的為一組。每一組的平均構(gòu)象稱為一個(gè)旋轉(zhuǎn)異構(gòu)體。在半柔性模型中,每個(gè)側(cè)鏈的構(gòu)象可以采用任意一種最常出現(xiàn)的旋轉(zhuǎn)異構(gòu)體 (rotamer)

36、。COMPANYLOGO分子疊合圖分子疊合圖COMPANYLOGO 除了要考慮疏水作用,蛋白折疊的能量函數(shù)中還要考慮到氫鍵、二硫橋的除了要考慮疏水作用,蛋白折疊的能量函數(shù)中還要考慮到氫鍵、二硫橋的形成、靜電作用、范德華力以及溶劑作用。由于這些力中每一個(gè)力的相對(duì)作形成、靜電作用、范德華力以及溶劑作用。由于這些力中每一個(gè)力的相對(duì)作用還很難通過(guò)實(shí)驗(yàn)來(lái)計(jì)算,因此尋找一個(gè)合適的蛋白折疊復(fù)合能量函數(shù)仍然用還很難通過(guò)實(shí)驗(yàn)來(lái)計(jì)算,因此尋找一個(gè)合適的蛋白折疊復(fù)合能量函數(shù)仍然是一個(gè)研究熱點(diǎn)。是一個(gè)研究熱點(diǎn)。 我們可以通過(guò)理論方法,針對(duì)范德華力、氫鍵、溶劑、靜電和其它力對(duì)一我們可以通過(guò)理論方法,針對(duì)范德華力、氫鍵、

37、溶劑、靜電和其它力對(duì)一個(gè)已折疊蛋白總體穩(wěn)定性的相對(duì)作用來(lái)建立能量函數(shù)。它的目標(biāo)是得到一個(gè)個(gè)已折疊蛋白總體穩(wěn)定性的相對(duì)作用來(lái)建立能量函數(shù)。它的目標(biāo)是得到一個(gè)近似的能量函數(shù)或者力場(chǎng),那些已知結(jié)構(gòu)的蛋白質(zhì)結(jié)晶構(gòu)象在這個(gè)能量函數(shù)近似的能量函數(shù)或者力場(chǎng),那些已知結(jié)構(gòu)的蛋白質(zhì)結(jié)晶構(gòu)象在這個(gè)能量函數(shù)中處于一個(gè)最小能量的狀態(tài)。例如:中處于一個(gè)最小能量的狀態(tài)。例如: G = Gvanderwaals + GH-bonds + Gsolvent + Gcoulomb7.5.3 能量函數(shù)和優(yōu)化能量函數(shù)和優(yōu)化COMPANYLOGO 如何尋找一些可行的能量函數(shù),本質(zhì)上是分子力學(xué)的問(wèn)題。而且,科學(xué)家確實(shí)已經(jīng)設(shè)計(jì)出了許多有

38、效的能量函數(shù)。但是從頭開(kāi)始預(yù)測(cè)蛋白結(jié)構(gòu)的方法由于種種原因還得不到令人滿意的結(jié)果。FoldingHome程序利用CPU的空閑時(shí)間來(lái)對(duì)蛋白折疊進(jìn)行計(jì)算。對(duì)于一個(gè)特定蛋白質(zhì)的計(jì)算,它首先被分成幾個(gè)不同的部分,然后這些不同的計(jì)算部分通過(guò)Internet被分配給不同的運(yùn)行FoldingHome程序的計(jì)算機(jī)來(lái)計(jì)算。最后,每個(gè)機(jī)器將得到的結(jié)果返回給服務(wù)器,服務(wù)器再對(duì)這些結(jié)果進(jìn)行合并和處理。7.5.3 能量函數(shù)和優(yōu)化能量函數(shù)和優(yōu)化COMPANYLOGO7.6結(jié)構(gòu)預(yù)測(cè)結(jié)構(gòu)預(yù)測(cè) v雖然很多蛋白折疊模型使得我們能夠越來(lái)越多地雖然很多蛋白折疊模型使得我們能夠越來(lái)越多地了解蛋白質(zhì)的折疊過(guò)程以及蛋白質(zhì)折疊過(guò)程中涉了解蛋白

39、質(zhì)的折疊過(guò)程以及蛋白質(zhì)折疊過(guò)程中涉及的各種分子力,但是目前還沒(méi)有一種從頭開(kāi)始及的各種分子力,但是目前還沒(méi)有一種從頭開(kāi)始進(jìn)行蛋白質(zhì)折疊的算法能夠很準(zhǔn)確地模擬出一些進(jìn)行蛋白質(zhì)折疊的算法能夠很準(zhǔn)確地模擬出一些大蛋白質(zhì)的空間結(jié)構(gòu)。大蛋白質(zhì)的空間結(jié)構(gòu)。v蛋白質(zhì)預(yù)測(cè)方法:蛋白質(zhì)預(yù)測(cè)方法:v(1比較建模同源建模)比較建模同源建模)v(2線索法:反向折疊蛋白線索法:反向折疊蛋白COMPANYLOGO7.6.1 同源建模同源建模 v 同源建模是通過(guò)與相近蛋白的結(jié)構(gòu)進(jìn)行比較來(lái)預(yù)測(cè)目標(biāo)蛋同源建模是通過(guò)與相近蛋白的結(jié)構(gòu)進(jìn)行比較來(lái)預(yù)測(cè)目標(biāo)蛋白的結(jié)構(gòu)的方法。白的結(jié)構(gòu)的方法。v 這種方法依賴于目標(biāo)序列和已知結(jié)構(gòu)蛋白的序列相

40、似度的這種方法依賴于目標(biāo)序列和已知結(jié)構(gòu)蛋白的序列相似度的強(qiáng)弱,依賴于折疊編碼。也就是說(shuō),蛋白質(zhì)氨基酸序列間強(qiáng)弱,依賴于折疊編碼。也就是說(shuō),蛋白質(zhì)氨基酸序列間的變化如果很小的話,那么蛋白質(zhì)的三級(jí)結(jié)構(gòu)的變化也很的變化如果很小的話,那么蛋白質(zhì)的三級(jí)結(jié)構(gòu)的變化也很小。小。COMPANYLOGO序列序列 構(gòu)造構(gòu)造 功能功能.-Gly-Ala-Glu-Phe-.功能功能蛋白質(zhì)結(jié)構(gòu)預(yù)測(cè)問(wèn)題蛋白質(zhì)結(jié)構(gòu)預(yù)測(cè)問(wèn)題COMPANYLOGO.-Gly-Ala-Glu-Phe-.功能功能?COMPANYLOGO.-Gly-Ala-Glu-Phe-.功能功能計(jì)算機(jī)輔助同源建模計(jì)算機(jī)輔助同源建模COMPANYLOGO同源建模

41、的過(guò)程同源建模的過(guò)程 (1尋找一系列與目標(biāo)蛋白相近的蛋白質(zhì)的結(jié)構(gòu)集。 通常利用像BLAST和FASTA這樣的序列數(shù)據(jù)庫(kù)搜索工具看來(lái)得到與目標(biāo)蛋白相近的序列集,進(jìn)而得到這些序列的結(jié)構(gòu)集。由于這些結(jié)構(gòu)在建模中是用作模板結(jié)構(gòu)的,因此這些結(jié)構(gòu)也稱為模板結(jié)構(gòu)。COMPANYLOGO同源建模的過(guò)程同源建模的過(guò)程(2將目標(biāo)序列與模板蛋白的序列進(jìn)行比對(duì)。 用像CLUSTALW這樣的多重比對(duì)工具產(chǎn)生比對(duì),發(fā)現(xiàn)目標(biāo)序列中與所有模板結(jié)構(gòu)高度保守的區(qū)域以及保守性不高的區(qū)域。當(dāng)目標(biāo)序列和模板序列相似度小于30%時(shí),自動(dòng)多重比對(duì)方法就不能得到高質(zhì)量的比對(duì)。此時(shí),必須對(duì)序列不必對(duì)進(jìn)行人工調(diào)節(jié)。COMPANYLOGO同源建模

42、的過(guò)程同源建模的過(guò)程 (3建立模型。 最普遍的方法就是將模板結(jié)構(gòu)疊加起來(lái),然后找到結(jié)構(gòu)上保守的區(qū)域。接著,這些模板結(jié)構(gòu)中保守的區(qū)域和與之相對(duì)應(yīng)的蛋白骨架比對(duì)排列,為要建立的模型形成一個(gè)核心。當(dāng)模板蛋白的結(jié)構(gòu)相似性比較低時(shí),就必須利用目標(biāo)蛋白二級(jí)結(jié)構(gòu)預(yù)測(cè)的方法、序列相似性方法和人工評(píng)估的方法為這一模型選擇正確的結(jié)構(gòu)。先建立模型的核心,再為L(zhǎng)oop區(qū)建模。COMPANYLOGO同源建模的過(guò)程同源建模的過(guò)程 (4Loop區(qū)建模: 使用最多的兩種方法是: a.從已知的Loop區(qū)構(gòu)象庫(kù)中選擇一個(gè)最優(yōu)的環(huán)區(qū)構(gòu)象; b.實(shí)行構(gòu)想搜索和評(píng)估。 盡管有很多方法可以用來(lái)對(duì)環(huán)區(qū)建模,但要得到一個(gè)長(zhǎng)于6個(gè)殘基的環(huán)區(qū)的準(zhǔn)確

溫馨提示

  • 1. 本站所有資源如無(wú)特殊說(shuō)明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請(qǐng)下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請(qǐng)聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁(yè)內(nèi)容里面會(huì)有圖紙預(yù)覽,若沒(méi)有圖紙預(yù)覽就沒(méi)有圖紙。
  • 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 人人文庫(kù)網(wǎng)僅提供信息存儲(chǔ)空間,僅對(duì)用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對(duì)用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對(duì)任何下載內(nèi)容負(fù)責(zé)。
  • 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請(qǐng)與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時(shí)也不承擔(dān)用戶因使用這些下載資源對(duì)自己和他人造成任何形式的傷害或損失。

評(píng)論

0/150

提交評(píng)論