HIV全基因組分析_第1頁
HIV全基因組分析_第2頁
HIV全基因組分析_第3頁
HIV全基因組分析_第4頁
HIV全基因組分析_第5頁
已閱讀5頁,還剩3頁未讀, 繼續(xù)免費(fèi)閱讀

下載本文檔

版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請進(jìn)行舉報或認(rèn)領(lǐng)

文檔簡介

1、HIV I全基因組分析HIV(human immunodeficiency virus)俗稱艾滋病毒(AIDS)是逆轉(zhuǎn)錄病毒的一類,引起人類獲得性免疫缺損綜合癥,長9.18kb。已發(fā)現(xiàn)的HIV有兩種:HIV I和HIVII. HIV I從歐洲和美洲分 離的毒株,致病力強(qiáng),是引起全球艾滋病流行的主要病原;HIV II毒力 較弱主要局限于西部非洲。一、資料:通過NCBI下載HIVI的全基因組序列,序列信息 如下:LOCUSNC_0018029181 bp ss-RNA linear VRL08-DEC-2008DEFINITIONHuman immunodeficiency virus 1, co

2、mplete genome.ACCESSIONVERSIONNC_001802NC_001802.1 GI:9629357DBLINKKEYWORDSProject:15476SOURCE Human immunodeficiency virus 1 (HIV-1)ORGANISM Human immunodeficiency virus 1 Viruses; Retro-transcribing viruses; Retroviridae;Orthoretrovirinae; Lentivirus; Primate lentivirus group.二、序列分析:1. 基因結(jié)構(gòu)及特點(diǎn)HIV-

3、1 的基因列順序?yàn)?LTR-gag-pol-vif-vpu-vpr-tat-rev-env-nef-LTR(如 圖.1)圖 1 HIV 基因結(jié)構(gòu)兩端是長末端重復(fù)序列( long terminal repeats, LTR ),含順 式調(diào)控序列,控制前病毒的表達(dá)。已證明在 LTR 有啟動子和增強(qiáng) 子并含負(fù)調(diào)控區(qū)。LTR之間的序列編碼了至少9個蛋白,可分為 三類:結(jié)構(gòu)蛋白、調(diào)控蛋白、輔助蛋白。(1)gag基因:長約1536個核苷酸,編碼合成約55KD非糖基化 的多聚蛋白前體(p55),隨后被pol基因編碼的一種病毒蛋白水解 酶裂解,加工為基質(zhì)蛋白p17、衣殼蛋白p24及核衣殼蛋白(NC)。(2)p

4、ol基因:長約3045個核苷酸,編碼合成160kD的gag-pol 前體蛋白,從N端至C端分別產(chǎn)生蛋白酶(PR)、逆轉(zhuǎn)錄酶(RT)、 核糖核酸酶H及整合酶。作用是參與多種蛋白的水解與合成,促進(jìn) 病毒整合入宿主細(xì)胞基因。pol基因是逆轉(zhuǎn)錄病毒中最保守的基因。(3)env基因:長約2589個核苷酸,主要編碼約826個氨基酸的 包膜前體蛋白,在病毒包膜成熟過程中,前體蛋白gp160經(jīng)過剪切 而成外膜糖蛋白gp120和跨膜糖蛋白gp41。Gp41與gp120以非共價 鍵形式相互結(jié)合,跨膜區(qū)的功能是促使毒粒穿入細(xì)胞。tat基因:表達(dá)激活蛋白,是HIV兩種重要的調(diào)節(jié)因子之一, 以兩種形式存在,編碼72aa

5、的tat-1基因和編碼86aa的tat-2基因(占 大多數(shù))。tat蛋白主要位于核內(nèi),激活轉(zhuǎn)錄的起始并促進(jìn)轉(zhuǎn)錄物的 延長。(5)rev基因:是HIV第2種必需的調(diào)節(jié)因子,編碼一種96kD的 磷蛋白,主要定位于核內(nèi),rev結(jié)合于RRE,促使病毒轉(zhuǎn)錄出各種 mRNA,由細(xì)胞核進(jìn)入胞漿,并使其保持穩(wěn)定。rev被認(rèn)為是慢病毒 最保守的調(diào)節(jié)基因。vif基因:也稱病毒感染因子,編碼23kD蛋白,增強(qiáng)病毒的 感染性,但不能提高病毒顆粒產(chǎn)量。最近研究表明vif蛋白主要的功 能是調(diào)節(jié)病毒復(fù)制、組裝、出芽,成熟的vif蛋白可以特異性地與蛋 白酶相互作用。vpr基因:編碼產(chǎn)物為病毒蛋白R,與p55 Gag蛋白前體中

6、的 p6相互作用。Vpr蛋白主要存在于核內(nèi)或質(zhì)膜上,作為核定位信號,介導(dǎo)未整合的原病毒復(fù)合物進(jìn)入細(xì)胞核,抑制細(xì)胞生長反式作 用于HIV-1LTR結(jié)構(gòu)中的啟動子和細(xì)胞基因的啟動子,激活細(xì)胞基因 的表達(dá),還可以誘導(dǎo)細(xì)胞的分化。與vpx基因具有較高的同源性。vpu基因:是HIV-1特有的。Vpu蛋白由81aa組成,分子量 為16kD,是一種整合膜蛋白,不存在于病毒粒子中。Vpu生物學(xué)功 能至少有兩種:介導(dǎo)內(nèi)質(zhì)網(wǎng)中CD4降解和促進(jìn)病毒粒子從被感染細(xì) 胞的質(zhì)膜上釋放。Vpu蛋白還涉及到env的裝配,增強(qiáng)HIV-1感染細(xì) 胞對FAS因子的敏感性。nef基因:編碼多功能nef蛋白,分子量約27kD,是一種負(fù)

7、調(diào) 控蛋白,依靠十四烷基殘基保守區(qū)上的第2位氨基酸定位于宿主細(xì) 胞膜內(nèi)面,是病毒增殖的早期基因產(chǎn)物,也是病毒感染細(xì)胞后產(chǎn)生 的第一種蛋白。是HIV所有輔助蛋白中免疫原性最強(qiáng)的。Nef可以下 調(diào)CD4細(xì)胞和MHC-I分子;可以增強(qiáng)病毒的感染性,參與病毒和細(xì) 胞轉(zhuǎn)錄的負(fù)調(diào)控,通過抑制病毒LTR的功能,干擾病毒的基因轉(zhuǎn) 錄。HIVI基因組比較小,是由連續(xù)的核糖核苷酸構(gòu)成。此外從 HIVI 基因的結(jié)構(gòu)圖中可以看出,HIVI中存在重疊基因,這樣種結(jié)構(gòu)使 像它這樣的較小的病毒基因組能夠攜帶較多的遺傳信息。重疊既有 完全重疊也有部分重疊。HIV I編碼區(qū)域也與一般病毒基因組的特 點(diǎn)相似,編碼區(qū)段站整個基因組

8、的 93%。2.堿基特點(diǎn)分析HIV I全基因組的GC含量占42%;CG24%TA四種核苷酸出現(xiàn)的頻率如圖2.1:CG24%TA四種核苷酸出現(xiàn)的頻率如圖2.1:圖2.1四種堿基出現(xiàn)的頻率(1)G/C含量的差異采用200bp的窗口大小,以20bp的大小從5端向3端滑動,計 算G-C/G+C。最后以基因組相對位置為橫坐標(biāo),G-C/G+C的值為縱 坐標(biāo)作圖。如圖2.2。 圖2.3G-C/G+C累加。圖2.2 G-C/G+C分值圖SOAccumulation of G-C/G+C604020-i -in .dll Fin w1 0圖2.2 G-C/G+C分值圖SOAccumulation of G-C/

9、G+C604020-i -in .dll Fin w1 0圖2.2 G-C/G+C累加值圖與原核生物基因組中的G與C含量的偏差的變化不同,原核生物的 復(fù)制起點(diǎn)處G-C累加值達(dá)到最低,在終點(diǎn)處又增大到最大。而 HIV I病毒基因組中大部分片段處G的含量高于C的含量。(2)核苷酸的關(guān)聯(lián)度分析進(jìn)一步的統(tǒng)計分析可以發(fā)現(xiàn),在HIVI基因組中,兩個連續(xù)核 苷酸出現(xiàn)的頻率也是不相同的。4種核苷酸可以組合成16種兩聯(lián)核 苷酸。為了計算每個核苷酸對(i,j)的出現(xiàn)頻率,掃描整個基因組 DNA序列,累計核苷酸j在核苷酸i之后出現(xiàn)的次數(shù),再除以總核苷 酸對的數(shù)目。在單條DNA序列上,總核苷酸對的數(shù)目等于序列的長 度

10、減1。對HIV基因組兩聯(lián)核苷酸的統(tǒng)計結(jié)果見下表,其中,核苷酸 對出現(xiàn)頻率最高的達(dá)到21%,而出現(xiàn)頻率最低的只有2%。如下表2 所示:表2核昔酸對的統(tǒng)計Pattern:Times Found:Percentage:Pattern:Times Found:Percentage:GG48811GA76917GT4069GC4259AG97121AA81118AT69015AC52411三、密碼子偏好性分析:Pattern:Times Found:Percentage:TG54612TA66214TT4069TC3157CG822CA75416CT4279CC3077對HIV I基因組的密碼子偏好性進(jìn)

11、行了統(tǒng)計如下:PheUUU511.44SerUCU310.70TyrUAU390.95CysUGU521.12UUC200.56UCC300.68UAC431.05UGC410.88LeuUUA290.85UCA410.93TERUAA941.17TERUGA690.86UUG441.29UCG60.14UAG790.98TrpUGG591.00CUU401.18ProCCU341.31HisCAU551.01ArgCGU20.04CUC200.59CCC301.15CAC540.99CGC30.07CUA341.00CCA351.35GlnCAA590.77CGA110.25CUG371.0

12、9CCG50.19CAG941.23CGG80.18IleAUU661.22ThrACU471.01AsnAAU901.29SerAGU841.91AUC400.74ACC460.98AAC490.71AGC721.64AUA561.04ACA901.93LysAAA1351.21ArgAGA1403.12MetAUG411.00ACG40.09AAG890.79AGG1052.34ValGUU291.18AlaGCU371.10AspGAU501.00GlyGGU310.63GUC80.33GCC371.10GAC501.00GGC440.89GUA281.14GCA521.55GluGAA

13、671.06GGA711.43GUG331.35GCG80.24GAG600.94GGG521.05四、同源性分析通過在線BLAST搜索發(fā)現(xiàn)以下幾個基因組與HIV I同源性非常高,它們都是HIV病毒的不同亞型:gblAF070521.1IAF070521 HIV-1 E9 from the USA, complete genome Length=9699emb|Z11530.1i Human Immunodeficiency virus I (HIV-1) RNAgb|U26942.11HTV1U26942 Human immunodeficiency virus clone pNL4-3, subclone 4.20gb|M1992L1HIVNL43 Human immunodeficiency virus type 1, NY5/BRU (LAV-1) recombinantgb|AF324493.1|AF324493 HIV-1 vector pNL4-3, complete sequencegb|EU541617.1|

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
  • 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 人人文庫網(wǎng)僅提供信息存儲空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負(fù)責(zé)。
  • 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時也不承擔(dān)用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。