分子進(jìn)化與系統(tǒng)發(fā)育分析課件_第1頁
分子進(jìn)化與系統(tǒng)發(fā)育分析課件_第2頁
分子進(jìn)化與系統(tǒng)發(fā)育分析課件_第3頁
分子進(jìn)化與系統(tǒng)發(fā)育分析課件_第4頁
分子進(jìn)化與系統(tǒng)發(fā)育分析課件_第5頁
已閱讀5頁,還剩91頁未讀 繼續(xù)免費(fèi)閱讀

下載本文檔

版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請進(jìn)行舉報或認(rèn)領(lǐng)

文檔簡介

生物信息學(xué)第六章分子進(jìn)化與系統(tǒng)發(fā)育分析生物信息學(xué)第六章分子進(jìn)化與系統(tǒng)發(fā)育分析1生物學(xué)家:Wehaveadream…1.TreeofLife:重建所有生物的進(jìn)化歷史并以系統(tǒng)樹的形式加以描述生物學(xué)家:Wehaveadream…1.Treeo2夢想走進(jìn)現(xiàn)實(shí):How?1.最理想的方法:化石!——然而…零散、不完整2.比較形態(tài)學(xué)和比較生理學(xué):確定大致的進(jìn)化框架?!欢?,細(xì)節(jié)存在巨多的爭議夢想走進(jìn)現(xiàn)實(shí):How?1.最理想的方法:化石!——然而…3第三種方案:分子進(jìn)化1.1964年,LinusPauling提出分子進(jìn)化理論;2.DNA&RNA:4種堿基;蛋白質(zhì)分子:20種氨基酸;3.發(fā)生在分子層面的進(jìn)化過程:DNA,RNA和蛋白質(zhì)分子;4.基本假設(shè):核苷酸和氨基酸序列中含有生物進(jìn)化歷史的全部信息;第三種方案:分子進(jìn)化1.1964年,LinusPauli4分子進(jìn)化的模式1.DNA突變的模式:替代,插入,缺失,倒位;2.核苷酸替代:轉(zhuǎn)換(Transition)&顛換(Transversion);3.基因復(fù)制:多基因家族的產(chǎn)生以及偽基因的產(chǎn)生;A.單個基因復(fù)制–重組或者逆轉(zhuǎn)錄;B.染色體片斷復(fù)制;C.基因組復(fù)制;分子進(jìn)化的模式1.DNA突變的模式:替代,插入,缺失,倒位5(1)DNA突變的模式替代插入缺失倒位(1)DNA突變的模式替代插入缺失倒位6(2)核苷酸替代:轉(zhuǎn)換&顛換1.轉(zhuǎn)換:嘌呤被嘌呤替代,或者嘧啶被嘧啶替代;2.顛換:嘌呤被嘧啶替代,或者嘧啶被嘌呤替代;(2)核苷酸替代:轉(zhuǎn)換&顛換1.轉(zhuǎn)換:嘌呤被嘌呤替代7基因復(fù)制:單個基因復(fù)制重組逆轉(zhuǎn)錄基因復(fù)制:單個基因復(fù)制重組逆轉(zhuǎn)錄8基因復(fù)制:染色體片段復(fù)制基因復(fù)制:染色體片段復(fù)制9基因復(fù)制:基因組復(fù)制S.Cerevisiae(釀酒酵母)K.Waltii(克魯雄酵母)研究結(jié)果:克魯雄酵母中的同源基因數(shù)量與釀酒酵母相比為1:2基因復(fù)制:基因組復(fù)制S.Cerevisiae(釀酒酵母)10分子進(jìn)化研究的目的1.從物種的一些分子特性出發(fā),構(gòu)建系統(tǒng)發(fā)育樹,進(jìn)而了解物種之間的生物系統(tǒng)發(fā)生的關(guān)系——treeoflife;物種分類;2.大分子功能與結(jié)構(gòu)的分析:同一家族的大分子,具有相似的三級結(jié)構(gòu)及生化功能,通過序列同源性分析,構(gòu)建系統(tǒng)發(fā)育樹,進(jìn)行相關(guān)分析;功能預(yù)測;3.進(jìn)化速率分析:例如,HIV的高突變性;哪些位點(diǎn)易發(fā)生突變?分子進(jìn)化研究的目的1.從物種的一些分子特性出發(fā),構(gòu)建系統(tǒng)發(fā)11(1)TreeofLife:16SrRNA(1)TreeofLife:16SrRNA12OutofAfrica53個人的線粒體基因組(16,587bp)人類遷移的路線OutofAfrica53個人的線粒體基因組(16,5813(2)同源性分析->功能相似性O(shè)rtholog(直系同源物):兩個基因通過物種形成的事件而產(chǎn)生,或,源于不同物種的最近的共同祖先的兩個基因,或者兩個物種中的同一基因,一般具有相同的功能。Paralog(旁系同源物):兩個基因在同一物種中,通過至少一次基因復(fù)制的事件而產(chǎn)生。Xenolog(異同源物):由某一個水平基因轉(zhuǎn)移事件而得到的同源序列。Convergentevolution:通過不同的進(jìn)化途徑獲得相似的功能,或者,功能替代物。(2)同源性分析->功能相似性O(shè)rtholog(直系同源14paralogsorthologsparalogsorthologs15異同源物異同源物16基因的趨同進(jìn)化通過不同的進(jìn)化過程獲得保守的功能基因的趨同進(jìn)化17趨同進(jìn)化:Langur食葉猴RNASE:纖維素分解、消化趨同進(jìn)化:Langur食葉猴RNASE:纖維素分解、消化18同源關(guān)系的分析1.直系同源物的確定:ReciprocalBestHits;2.旁系同源物的確定:BLAST,序列比對及數(shù)據(jù)庫搜索,至少存在一個共有的功能結(jié)構(gòu)域;3.整體分析/蛋白質(zhì)家族分析:系統(tǒng)發(fā)育樹的構(gòu)建;同源關(guān)系的分析1.直系同源物的確定:ReciprocalB19ReciprocalBestHits?直系同源物:ReciprocalBestHitsReciprocalBestHits?直系同源物:Rec20(3)HIVprotease:高突變性Ka/Ks>>1,強(qiáng)的正選擇壓力,具有很高的可突變性(3)HIVprotease:高突變性Ka/Ks>>21本章內(nèi)容提要1.密碼子偏好及相應(yīng)分析;2.氨基酸序列的進(jìn)化演變;3.DNA序列的進(jìn)化演變;4.同義與非同義的核苷酸替代;5.系統(tǒng)發(fā)育樹的構(gòu)建;6.分子鐘與線性樹;7.MEGA軟件的使用;本章內(nèi)容提要1.密碼子偏好及相應(yīng)分析;22第一節(jié)密碼子偏好及相應(yīng)分析1.密碼子(codon):在隨機(jī)或者無自然選擇的情況下,各個密碼子出現(xiàn)頻率將大致相等。2.密碼子偏好:各個物種中,編碼同一氨基酸的不同同義密碼子的頻率非常不一致;3.可能的原因:密碼子對應(yīng)的同功tRNA豐度的不同。第一節(jié)密碼子偏好及相應(yīng)分析1.密碼子(codon):在23標(biāo)準(zhǔn)密碼子標(biāo)準(zhǔn)密碼子24大腸桿菌RNA聚合酶大腸桿菌RNA聚合酶25大腸桿菌RNA聚合酶(2)1.密碼子偏好非常明顯;例如2.同為編碼Phe的同義密碼子UUU和UUC,二者出現(xiàn)的次數(shù)顯著不等,UUU(15次),UUC(44次);3.再如:編碼Arg的四個密碼子CGU,CGC,CGA,CGG,出現(xiàn)次數(shù)分別為:89,46,1,0.4.提示:對應(yīng)CGG的同功tRNA可能不存在!大腸桿菌RNA聚合酶(2)1.密碼子偏好非常明顯;例如26tRNA&Anticodon1.每一個密碼子,對應(yīng)一個tRNA;2.tRNA通過Anticodon來識別codon,聯(lián)系mRNA和氨基酸序列的合成;3.密碼子的使用偏好:由密碼子對應(yīng)的tRNA的進(jìn)化及豐度來決定。tRNA&Anticodon1.每一個密碼子,對應(yīng)一個27堿基出現(xiàn)的頻率1.假如:每個核苷酸位點(diǎn)上的替代是隨機(jī)發(fā)生的,則A,T,C,G出現(xiàn)的頻率應(yīng)該大致相等;2.實(shí)際情況:DNA受到自然選擇的壓力,各個位點(diǎn)的堿基出現(xiàn)頻率并不相等;3.需要解決的問題:A.每個位點(diǎn)上受到什么樣的選擇壓力?B.各個位點(diǎn)的堿基頻率反映了什么樣的規(guī)律?4.表征/統(tǒng)計的方法:計算G+C的含量,并進(jìn)行比較;堿基出現(xiàn)的頻率1.假如:每個核苷酸位點(diǎn)上的替代是隨機(jī)發(fā)生的28分子進(jìn)化的理論1.陽性選擇,適應(yīng)性進(jìn)化,達(dá)爾文進(jìn)化:DNA分子顯著出現(xiàn)非同義替代,改變編碼蛋白質(zhì)的氨基酸組成,并產(chǎn)生新的功能;2.陰性選擇,凈化選擇:DNA分子的同義替代顯著,較少改變蛋白質(zhì)的氨基酸組成,其原來的功能高度保守;3.中性進(jìn)化:同義替代與非同義替代比例相當(dāng),突變不好不壞,不改變或輕微改變蛋白質(zhì)的功能。分子進(jìn)化的理論1.陽性選擇,適應(yīng)性進(jìn)化,達(dá)爾文進(jìn)化:DNA29同義替代vs.非同義替代GCGGTTTGGGAGGCGGTCTGCGAC64個密碼子,編碼20個氨基酸GTTGTCGTAGTGCGTCGC脯氨酸P組氨酸H四倍簡并二倍簡并TGGTGC色氨酸W半胱氨酸C同義替代非同義替代同義替代vs.非同義替代GCGGTTTGGGAGGCGG30編碼區(qū)vs.非編碼區(qū)1.編碼區(qū):DNA上編碼功能性的基因的部分;2.非編碼區(qū):或稱基因組序列,絕大部分無功能;3.選擇壓力:A.編碼區(qū):陽性選擇1%;中性進(jìn)化:80%;陰性進(jìn)化:19%;B.非編碼區(qū):~100%的中性進(jìn)化;編碼區(qū)vs.非編碼區(qū)1.編碼區(qū):DNA上編碼功能性的基31編碼區(qū):密碼子1.對于同義的密碼子,第一位少部分可以允許不同,例如,編碼Ser的六個密碼子:TCT,TCC,TCA,TCG,AGT,AGC;2.第二位必須相同;3.第三位絕大多數(shù)可以不同->近似隨機(jī);4.因此:A.第一位:陰性進(jìn)化占大部分,中性進(jìn)化占小部分;B.第二位:陰性進(jìn)化;C.第三位:陰性進(jìn)化占小部分,中性進(jìn)化占大部分;編碼區(qū):密碼子1.對于同義的密碼子,第一位少部分可以允許不32編碼區(qū)&密碼子:推論1.密碼子第三位的堿基出現(xiàn)概率接近基因組序列的堿基頻率;2.第二位的堿基出現(xiàn)頻率與基因組序列的基建頻率相差最大;編碼區(qū)&密碼子:推論1.密碼子第三位的堿基出現(xiàn)概率接3311個細(xì)菌基因組與密碼子三個位置上的GC含量的關(guān)系細(xì)菌基因組的GC含量:25%~75%11個細(xì)菌基因組與密碼子三個位置上的GC含量的關(guān)系細(xì)菌基因組34密碼子偏好的應(yīng)用及計算1.基本假設(shè):在高表達(dá)的基因中,密碼子的選擇,更傾向于使用“優(yōu)化”的同義密碼子;2.推論1:給定一個物種的一些高表達(dá)的基因,我們可以估算優(yōu)化的同義密碼子的分布;3.推論2:接著,我們可以對給定的一個未知基因的序列進(jìn)行密碼子分布的分析,預(yù)測該基因的表達(dá)量!4.推論3:對于一個表達(dá)量很低的基因,我們是否能夠通過將少量的密碼子改變成優(yōu)化密碼子,從而顯著提高基因的表達(dá)量?密碼子偏好的應(yīng)用及計算1.基本假設(shè):在高表達(dá)的基因中,密碼35RSCU1.相對密碼子使用頻率(relativesynonymouscodonusage,RSCU);2.定義:觀測到的某一同一密碼子的使用次數(shù),除以“期望”的該密碼子出現(xiàn)次數(shù)。編碼第i個氨基酸的第j個密碼子的觀測值編碼第i氨基酸的同義密碼子的數(shù)目編碼第i個氨基酸的第j個密碼子的RSCU值RSCU1.相對密碼子使用頻率(relativesyno36密碼子:therelativeadaptation1.編碼第i個氨基酸的第j個同義密碼子的“相對適應(yīng)性”:2.即,該同義密碼子的觀察值,除以編碼該氨基酸的同義密碼子的最大值。密碼子:therelativeadaptation1.37大腸桿菌&酵母大腸桿菌&酵母38CAI:codonAdaptationIndex其中,另外,L為序列的長度CAI:codonAdaptationIndex其中,39例:大腸桿菌的rpsUrpsU包含70個codon,部分序列如下:例:大腸桿菌的rpsUrpsU包含70個codon,部分序列40大腸桿菌和酵母:部分基因的CAI大腸桿菌和酵母:部分基因的CAI41異源基因:在其他物種中的CAI異源基因:在其他物種中的CAI42第二節(jié)氨基酸序列的進(jìn)化演變1.分子進(jìn)化的分析:基于氨基酸序列的分析早于DNA序列。2.優(yōu)勢:氨基酸序列更為保守,對年代跨度大的進(jìn)化分析有幫助;數(shù)學(xué)模型較DNA遠(yuǎn)為簡單;3.p距離:p-distance;4.泊松校正,d距離;5.Г距離;第二節(jié)氨基酸序列的進(jìn)化演變1.分子進(jìn)化的分析:基于氨基酸43P-distance1.另兩條蛋白質(zhì)序列之間的氨基酸差異數(shù)為nd,所有序列的氨基酸數(shù)目相同為n,則P距離不同物種的血紅蛋白α鏈中不同氨基酸的數(shù)目及比例。長度:140aa所有的插入/缺失都要刪除!P-distance1.另兩條蛋白質(zhì)序列之間的氨基酸差異數(shù)44PC:泊松校正1.序列差異的百分比(p)與分歧時間t的關(guān)系:t較短的時候,回復(fù)突變較少,兩者大致成線性關(guān)系;當(dāng)t較大時,回復(fù)突變增多,二者成非線性關(guān)系;2.令r為某一位點(diǎn)每年的氨基酸替代率,并假設(shè)所有為點(diǎn)的r都相同:基本假設(shè);3.在時間t年之后,每個位點(diǎn)替代的平均數(shù)為:rt;給定一個位點(diǎn),氨基酸替代數(shù)k(k=0,1,2,3,…)的可能性遵循泊松分布,即4.因此,某一位點(diǎn)氨基酸不變的概率為PC:泊松校正1.序列差異的百分比(p)與分歧時間t的關(guān)系45PC:泊松校正(2)1.祖先序列未知:不知道當(dāng)前的序列從何演化而來。2.解決方案:對兩條已經(jīng)有t年分化的序列,一條序列無替代的概率為:,兩條序列則為:3.q=1-p;4.泊松校正距離d=2rt5.因此,d=-ln(1-p),即泊松距離。PC:泊松校正(2)1.祖先序列未知:不知道當(dāng)前的序列從46P-距離vs.泊松距離P-距離vs.泊松距離47Г距離1.p-距離和d-距離:氨基酸替代率在所有位點(diǎn)是相同的;2.實(shí)際情況:功能次要的位點(diǎn)比功能重要的位點(diǎn)替代率更高;3.實(shí)際觀測:每個位點(diǎn)氨基酸替代率(k)的分布方差大于泊松方差,且此方差近似遵循負(fù)二項(xiàng)分布;4.理論上,恰好:如果氨基酸替代率r按照Г分布,則氨基酸替代的觀察值將按負(fù)二項(xiàng)是分布;Г距離1.p-距離和d-距離:氨基酸替代率在所有位點(diǎn)是相同48生物信息學(xué)第六章分子進(jìn)化與系統(tǒng)發(fā)育分析生物信息學(xué)第六章分子進(jìn)化與系統(tǒng)發(fā)育分析49生物學(xué)家:Wehaveadream…1.TreeofLife:重建所有生物的進(jìn)化歷史并以系統(tǒng)樹的形式加以描述生物學(xué)家:Wehaveadream…1.Treeo50夢想走進(jìn)現(xiàn)實(shí):How?1.最理想的方法:化石!——然而…零散、不完整2.比較形態(tài)學(xué)和比較生理學(xué):確定大致的進(jìn)化框架。——然而,細(xì)節(jié)存在巨多的爭議夢想走進(jìn)現(xiàn)實(shí):How?1.最理想的方法:化石!——然而…51第三種方案:分子進(jìn)化1.1964年,LinusPauling提出分子進(jìn)化理論;2.DNA&RNA:4種堿基;蛋白質(zhì)分子:20種氨基酸;3.發(fā)生在分子層面的進(jìn)化過程:DNA,RNA和蛋白質(zhì)分子;4.基本假設(shè):核苷酸和氨基酸序列中含有生物進(jìn)化歷史的全部信息;第三種方案:分子進(jìn)化1.1964年,LinusPauli52分子進(jìn)化的模式1.DNA突變的模式:替代,插入,缺失,倒位;2.核苷酸替代:轉(zhuǎn)換(Transition)&顛換(Transversion);3.基因復(fù)制:多基因家族的產(chǎn)生以及偽基因的產(chǎn)生;A.單個基因復(fù)制–重組或者逆轉(zhuǎn)錄;B.染色體片斷復(fù)制;C.基因組復(fù)制;分子進(jìn)化的模式1.DNA突變的模式:替代,插入,缺失,倒位53(1)DNA突變的模式替代插入缺失倒位(1)DNA突變的模式替代插入缺失倒位54(2)核苷酸替代:轉(zhuǎn)換&顛換1.轉(zhuǎn)換:嘌呤被嘌呤替代,或者嘧啶被嘧啶替代;2.顛換:嘌呤被嘧啶替代,或者嘧啶被嘌呤替代;(2)核苷酸替代:轉(zhuǎn)換&顛換1.轉(zhuǎn)換:嘌呤被嘌呤替代55基因復(fù)制:單個基因復(fù)制重組逆轉(zhuǎn)錄基因復(fù)制:單個基因復(fù)制重組逆轉(zhuǎn)錄56基因復(fù)制:染色體片段復(fù)制基因復(fù)制:染色體片段復(fù)制57基因復(fù)制:基因組復(fù)制S.Cerevisiae(釀酒酵母)K.Waltii(克魯雄酵母)研究結(jié)果:克魯雄酵母中的同源基因數(shù)量與釀酒酵母相比為1:2基因復(fù)制:基因組復(fù)制S.Cerevisiae(釀酒酵母)58分子進(jìn)化研究的目的1.從物種的一些分子特性出發(fā),構(gòu)建系統(tǒng)發(fā)育樹,進(jìn)而了解物種之間的生物系統(tǒng)發(fā)生的關(guān)系——treeoflife;物種分類;2.大分子功能與結(jié)構(gòu)的分析:同一家族的大分子,具有相似的三級結(jié)構(gòu)及生化功能,通過序列同源性分析,構(gòu)建系統(tǒng)發(fā)育樹,進(jìn)行相關(guān)分析;功能預(yù)測;3.進(jìn)化速率分析:例如,HIV的高突變性;哪些位點(diǎn)易發(fā)生突變?分子進(jìn)化研究的目的1.從物種的一些分子特性出發(fā),構(gòu)建系統(tǒng)發(fā)59(1)TreeofLife:16SrRNA(1)TreeofLife:16SrRNA60OutofAfrica53個人的線粒體基因組(16,587bp)人類遷移的路線OutofAfrica53個人的線粒體基因組(16,5861(2)同源性分析->功能相似性O(shè)rtholog(直系同源物):兩個基因通過物種形成的事件而產(chǎn)生,或,源于不同物種的最近的共同祖先的兩個基因,或者兩個物種中的同一基因,一般具有相同的功能。Paralog(旁系同源物):兩個基因在同一物種中,通過至少一次基因復(fù)制的事件而產(chǎn)生。Xenolog(異同源物):由某一個水平基因轉(zhuǎn)移事件而得到的同源序列。Convergentevolution:通過不同的進(jìn)化途徑獲得相似的功能,或者,功能替代物。(2)同源性分析->功能相似性O(shè)rtholog(直系同源62paralogsorthologsparalogsorthologs63異同源物異同源物64基因的趨同進(jìn)化通過不同的進(jìn)化過程獲得保守的功能基因的趨同進(jìn)化65趨同進(jìn)化:Langur食葉猴RNASE:纖維素分解、消化趨同進(jìn)化:Langur食葉猴RNASE:纖維素分解、消化66同源關(guān)系的分析1.直系同源物的確定:ReciprocalBestHits;2.旁系同源物的確定:BLAST,序列比對及數(shù)據(jù)庫搜索,至少存在一個共有的功能結(jié)構(gòu)域;3.整體分析/蛋白質(zhì)家族分析:系統(tǒng)發(fā)育樹的構(gòu)建;同源關(guān)系的分析1.直系同源物的確定:ReciprocalB67ReciprocalBestHits?直系同源物:ReciprocalBestHitsReciprocalBestHits?直系同源物:Rec68(3)HIVprotease:高突變性Ka/Ks>>1,強(qiáng)的正選擇壓力,具有很高的可突變性(3)HIVprotease:高突變性Ka/Ks>>69本章內(nèi)容提要1.密碼子偏好及相應(yīng)分析;2.氨基酸序列的進(jìn)化演變;3.DNA序列的進(jìn)化演變;4.同義與非同義的核苷酸替代;5.系統(tǒng)發(fā)育樹的構(gòu)建;6.分子鐘與線性樹;7.MEGA軟件的使用;本章內(nèi)容提要1.密碼子偏好及相應(yīng)分析;70第一節(jié)密碼子偏好及相應(yīng)分析1.密碼子(codon):在隨機(jī)或者無自然選擇的情況下,各個密碼子出現(xiàn)頻率將大致相等。2.密碼子偏好:各個物種中,編碼同一氨基酸的不同同義密碼子的頻率非常不一致;3.可能的原因:密碼子對應(yīng)的同功tRNA豐度的不同。第一節(jié)密碼子偏好及相應(yīng)分析1.密碼子(codon):在71標(biāo)準(zhǔn)密碼子標(biāo)準(zhǔn)密碼子72大腸桿菌RNA聚合酶大腸桿菌RNA聚合酶73大腸桿菌RNA聚合酶(2)1.密碼子偏好非常明顯;例如2.同為編碼Phe的同義密碼子UUU和UUC,二者出現(xiàn)的次數(shù)顯著不等,UUU(15次),UUC(44次);3.再如:編碼Arg的四個密碼子CGU,CGC,CGA,CGG,出現(xiàn)次數(shù)分別為:89,46,1,0.4.提示:對應(yīng)CGG的同功tRNA可能不存在!大腸桿菌RNA聚合酶(2)1.密碼子偏好非常明顯;例如74tRNA&Anticodon1.每一個密碼子,對應(yīng)一個tRNA;2.tRNA通過Anticodon來識別codon,聯(lián)系mRNA和氨基酸序列的合成;3.密碼子的使用偏好:由密碼子對應(yīng)的tRNA的進(jìn)化及豐度來決定。tRNA&Anticodon1.每一個密碼子,對應(yīng)一個75堿基出現(xiàn)的頻率1.假如:每個核苷酸位點(diǎn)上的替代是隨機(jī)發(fā)生的,則A,T,C,G出現(xiàn)的頻率應(yīng)該大致相等;2.實(shí)際情況:DNA受到自然選擇的壓力,各個位點(diǎn)的堿基出現(xiàn)頻率并不相等;3.需要解決的問題:A.每個位點(diǎn)上受到什么樣的選擇壓力?B.各個位點(diǎn)的堿基頻率反映了什么樣的規(guī)律?4.表征/統(tǒng)計的方法:計算G+C的含量,并進(jìn)行比較;堿基出現(xiàn)的頻率1.假如:每個核苷酸位點(diǎn)上的替代是隨機(jī)發(fā)生的76分子進(jìn)化的理論1.陽性選擇,適應(yīng)性進(jìn)化,達(dá)爾文進(jìn)化:DNA分子顯著出現(xiàn)非同義替代,改變編碼蛋白質(zhì)的氨基酸組成,并產(chǎn)生新的功能;2.陰性選擇,凈化選擇:DNA分子的同義替代顯著,較少改變蛋白質(zhì)的氨基酸組成,其原來的功能高度保守;3.中性進(jìn)化:同義替代與非同義替代比例相當(dāng),突變不好不壞,不改變或輕微改變蛋白質(zhì)的功能。分子進(jìn)化的理論1.陽性選擇,適應(yīng)性進(jìn)化,達(dá)爾文進(jìn)化:DNA77同義替代vs.非同義替代GCGGTTTGGGAGGCGGTCTGCGAC64個密碼子,編碼20個氨基酸GTTGTCGTAGTGCGTCGC脯氨酸P組氨酸H四倍簡并二倍簡并TGGTGC色氨酸W半胱氨酸C同義替代非同義替代同義替代vs.非同義替代GCGGTTTGGGAGGCGG78編碼區(qū)vs.非編碼區(qū)1.編碼區(qū):DNA上編碼功能性的基因的部分;2.非編碼區(qū):或稱基因組序列,絕大部分無功能;3.選擇壓力:A.編碼區(qū):陽性選擇1%;中性進(jìn)化:80%;陰性進(jìn)化:19%;B.非編碼區(qū):~100%的中性進(jìn)化;編碼區(qū)vs.非編碼區(qū)1.編碼區(qū):DNA上編碼功能性的基79編碼區(qū):密碼子1.對于同義的密碼子,第一位少部分可以允許不同,例如,編碼Ser的六個密碼子:TCT,TCC,TCA,TCG,AGT,AGC;2.第二位必須相同;3.第三位絕大多數(shù)可以不同->近似隨機(jī);4.因此:A.第一位:陰性進(jìn)化占大部分,中性進(jìn)化占小部分;B.第二位:陰性進(jìn)化;C.第三位:陰性進(jìn)化占小部分,中性進(jìn)化占大部分;編碼區(qū):密碼子1.對于同義的密碼子,第一位少部分可以允許不80編碼區(qū)&密碼子:推論1.密碼子第三位的堿基出現(xiàn)概率接近基因組序列的堿基頻率;2.第二位的堿基出現(xiàn)頻率與基因組序列的基建頻率相差最大;編碼區(qū)&密碼子:推論1.密碼子第三位的堿基出現(xiàn)概率接8111個細(xì)菌基因組與密碼子三個位置上的GC含量的關(guān)系細(xì)菌基因組的GC含量:25%~75%11個細(xì)菌基因組與密碼子三個位置上的GC含量的關(guān)系細(xì)菌基因組82密碼子偏好的應(yīng)用及計算1.基本假設(shè):在高表達(dá)的基因中,密碼子的選擇,更傾向于使用“優(yōu)化”的同義密碼子;2.推論1:給定一個物種的一些高表達(dá)的基因,我們可以估算優(yōu)化的同義密碼子的分布;3.推論2:接著,我們可以對給定的一個未知基因的序列進(jìn)行密碼子分布的分析,預(yù)測該基因的表達(dá)量!4.推論3:對于一個表達(dá)量很低的基因,我們是否能夠通過將少量的密碼子改變成優(yōu)化密碼子,從而顯著提高基因的表達(dá)量?密碼子偏好的應(yīng)用及計算1.基本假設(shè):在高表達(dá)的基因中,密碼83RSCU1.相對密碼子使用頻率(relativesynonymouscodonusage,RSCU);2.定義:觀測到的某一同一密碼子的使用次數(shù),除以“期望”的該密碼子出現(xiàn)次數(shù)。編碼第i個氨基酸的第j個密碼子的觀測值編碼第i氨基酸的同義密碼子的數(shù)目編碼第i個氨基酸的第j個密碼子的RSCU值RSCU1.相對密碼子使用頻率(relativesyno84密碼子:therelativeadaptation1.編碼第i個氨基酸的第j個同義密碼子的“相對適應(yīng)性”:2.即,該同義密碼子的觀察值,除以編碼該氨基酸的同義密碼子的最大值。密碼子:therelativeadaptation1.85大腸桿菌&酵母大腸桿菌&酵母86CAI:codonAd

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
  • 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 人人文庫網(wǎng)僅提供信息存儲空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負(fù)責(zé)。
  • 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時也不承擔(dān)用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。

評論

0/150

提交評論