microRNA相關(guān)問題的計算分析_第1頁
microRNA相關(guān)問題的計算分析_第2頁
microRNA相關(guān)問題的計算分析_第3頁
microRNA相關(guān)問題的計算分析_第4頁
microRNA相關(guān)問題的計算分析_第5頁
全文預(yù)覽已結(jié)束

下載本文檔

版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請進行舉報或認(rèn)領(lǐng)

文檔簡介

附件2論文中英文摘要作者姓名:汪小我論文題目:microRNA相關(guān)問題的計算分析作者簡介:汪小我,男,1980年6月出生,2003年9月師從于清華大學(xué)李衍達(dá)教授,2008年7月獲博士學(xué)位。中文摘要 1生物信息學(xué)是生命科學(xué)與信息科學(xué)、控制科學(xué)等多學(xué)科交叉的新興學(xué)科。近年來,人類:I基因組的測序完成和各類高通量生物實驗技術(shù)的發(fā)展,使得生物學(xué)數(shù)據(jù)呈指數(shù)級增長,如何:I用生物信息技術(shù)挖掘和分析這些海量的信息成為研究的焦點。同時,隨著生物信息學(xué)研究的:I不斷深入,它在解決重要的生物學(xué)問題、闡明新的生物學(xué)規(guī)律等方面發(fā)揮出巨大作用。 :ImicroRNA(miRNA,微小RNA)是近年來新發(fā)現(xiàn)的一類非編碼RNA,它在諸多重要生:I命過程中起著關(guān)鍵的調(diào)控作用,人們對其在疾病的診斷和治療等方面的應(yīng)用前景寄予厚望,:I關(guān)于miRNA的研究是當(dāng)前生命科學(xué)領(lǐng)域最前沿的方向之一。生物信息學(xué)在miRNA的研究中:I起到了關(guān)鍵作用,極大地推動了該領(lǐng)域的迅速發(fā)展。本論文的工作圍繞miRNA這一重要生:I物學(xué)問題展開,運用統(tǒng)計、機器學(xué)習(xí)和模式識別等多種生物信息學(xué)方法,對miRNA的識別、:I轉(zhuǎn)錄調(diào)控、進化機制等重要問題進行了多方面的探索,取得了一些創(chuàng)新成果。主要有以下四:I方面內(nèi)容: :I(1)提出了高效的同源miRNA識別算法,可用于預(yù)測遠(yuǎn)同源的miRNA基因。 :I要研究miRNA的功能,首先必須找到miRNA。在提出本課題時,用于發(fā)現(xiàn)新miRNA:I基因的實驗技術(shù)費時又費錢,而且很難找到那些表達(dá)量較低或者只在特定組織或發(fā)育階段中:I表達(dá)的miRNA。因此通過高通量的計算方法從基因組中篩選出可能的miRNA基因候選集合,,I可以對生物學(xué)實驗提供指導(dǎo)和參考,對推動miRNA研究具有重要意義。 :I同源基因預(yù)測是一類重要的基因識別方法,其出發(fā)點是利用基因在物種間的保守性,尋:I找已知基因的同源基因。這類方法可以將一個物種中找到的基因及其注釋推廣到其它物種中。I包括人類基因組在內(nèi)的多個物種的基因組測序完成為開展同源基因預(yù)測創(chuàng)造了條件。miRNA:I同源基因預(yù)測的難點在于miRNA自身的序列很短,只有約22個堿基,而基因組上的搜索空:I間卻很大,因此常用的序列比對方法只能用來尋找一些在序列上高度相似的miRNA,并且預(yù):I測結(jié)果具有很高的假陽性率。在深入了解miRNA相關(guān)的生物學(xué)過程后,我們注意到miRNA:I的前體pre-miRNA必須形成一個形似發(fā)卡環(huán)的RNA二級結(jié)構(gòu),才能被特定的酶正確加工,:I釋放出miRNA成熟體。雖然miRNA前體序列本身并不一定在物種間保持不變,但其發(fā)卡環(huán):I狀二級結(jié)構(gòu)卻往往非常保守?;谏鲜稣J(rèn)識,本論文在綜合考慮miRNA成熟體序列保守和:I前體結(jié)構(gòu)保守的基礎(chǔ)上,提出了將序列比對與結(jié)構(gòu)比對相結(jié)合的miRNA同源基因識別方法:ImiRAlign。該方法達(dá)到了國際上公開發(fā)表的同類算法中最高的敏感性和特異性,可用于預(yù)測:I遠(yuǎn)同源的miRNA基因,對miRNA的識別和進化模式研究具有重要價值。所提供的miRAlign:I網(wǎng)頁版計算服務(wù)被點擊使用二十余萬次。 :: (2)研究了miRNA在脊椎動物中的進化模式,為全面了解miRNA的功能及其在物種;:進化過程中的作用提供了新的視角。 [-在開展本項研究工作時,人們對miRNA這類重要調(diào)控因子的進化特性還知之甚少,大:;部分miRNA被認(rèn)為在漫長的物種進化過程中是高度保守、一成不變的。本論文利用miRAlign;[方法對當(dāng)時所有已測序的脊椎動物基因組進行分析,獲得了已知miRNA的同源基因,并通[[過分析miRNA基因家族在各物種中的分布情況,研究了miRNA在脊椎動物中的進化特性。[:本論文一是發(fā)現(xiàn)新產(chǎn)生的miRNA會經(jīng)歷一個近似中性進化的過程,之后逐漸固定下來,并在;;進化上趨于保守;二是觀察到miRNA在物種進化過程中存在系特異性(lineage-specific)的;:大規(guī)模復(fù)制現(xiàn)象,這種拷貝數(shù)的大量擴增對miRNA在胚胎發(fā)育的特定階段完成重要生物學(xué);;功能具有重要意義;三是注意到miRNA基因在發(fā)生串連復(fù)制后,部分同源的miRNA前體會[;選擇其發(fā)卡環(huán)不同臂上的序列作為成熟體,從而大大增加了miRNA新功能產(chǎn)生的可能性。這;;些現(xiàn)象表明,miRNA這一類重要的調(diào)控因子在物種進化過程中是十分活躍的,并且有著復(fù)雜:[的演化模式,這為全面了解miRNA的功能及其在物種進化過程中的作用提供了新的視角。[:這些觀察和推測陸續(xù)得到了國際上后續(xù)研究報道的支持。 [; (3)利用比較基因組學(xué)方法研究miRNA的轉(zhuǎn)錄調(diào)控機制,提出了序列比對與模體識別::相結(jié)合的序列調(diào)控元件分析方法。 [;隨著對miRNA研究的深入,miRNA本身的表達(dá)調(diào)控成為研究的焦點。研究發(fā)現(xiàn)miRNA:[的表達(dá)過程受到嚴(yán)格的調(diào)控,其中轉(zhuǎn)錄是最主要的調(diào)控環(huán)節(jié)。研究基因轉(zhuǎn)錄調(diào)控的重點是找::出基因啟動子區(qū)域中不同轉(zhuǎn)錄因子的結(jié)合位點,進而揭示基因的轉(zhuǎn)錄調(diào)控網(wǎng)絡(luò)。但由于轉(zhuǎn)錄:[因子結(jié)合位點通常都較短,并具有一定的簡并性,所含信息量有限,因此基于單一物種DNA;:序列信息的轉(zhuǎn)錄調(diào)控元件分析結(jié)果具有很高的假陽性率。為準(zhǔn)確預(yù)測和構(gòu)建miRNA基因的-:轉(zhuǎn)錄調(diào)控網(wǎng)絡(luò),本論文建立了一套基于遺傳印跡的轉(zhuǎn)錄調(diào)控元件識別方法,該方法綜合了多:[物種間基因組比較、DNA模體序列識別、調(diào)控模塊分析等多方面的信息,已被成功地運用于[:分析果蠅基因組中miRNA基因的轉(zhuǎn)錄調(diào)控模式。 [; (4)開發(fā)了新一代的基因核心啟動子計算機識別方法,能成功預(yù)測出大部分已知人類[:miRNA的核心啟動子。 [:基因的啟動子內(nèi)包含了決定基因轉(zhuǎn)錄起始時間和表達(dá)程度的主要信息,目前啟動子的識:[別是基因轉(zhuǎn)錄調(diào)控研究中的關(guān)鍵和難點。由于人類基因組中miRNA的轉(zhuǎn)錄起始位點往往遠(yuǎn)]:離成熟體,加之miRNA的初始轉(zhuǎn)錄產(chǎn)物pri-miRNA在細(xì)胞核內(nèi)被迅速加工和降解,使得通;;過實驗手段獲取miRNA啟動子非常困難,僅有極少量人類miRNA啟動子被實驗驗證;同時,::僅用DNA序列的信息又難以準(zhǔn)確預(yù)測啟動子。因此,miRNA啟動子的識別成為miRNA功[:能研究中主要瓶頸之一。 [;本論文在國際上率先提出了融合DNA序列和表觀遺傳修飾兩方面信息來識別人類基因::核心啟動子的方法。本研究通過對海量表觀基因組實驗數(shù)據(jù)的挖掘,在全基因組水平研究了:;幾十種不同的組蛋白修飾在基因啟動子區(qū)的特征模式,系統(tǒng)分析了這些模式與DNA序列特:[征以及基因表達(dá)量之間的聯(lián)系,并利用Boosting的方法融合多種特征,構(gòu)建了預(yù)測分類器。[;本論文提出的相關(guān)算法CoreBoost_HM在敏感性和特異性方面均顯著優(yōu)于國際上已有的基因::啟動子識別方法,能提供高分辨率的預(yù)測結(jié)果,并能用于識別miRNA等非編碼基因的啟動::子。 1關(guān)鍵詞:生物信息學(xué);microRNA;識別;進化;轉(zhuǎn)錄調(diào)控Computationalstudiesonrecognition,evolutionandtranscriptionalregulationofmicroRNAsXiaowoWangABSTRACT;Bioinformaticsisaninterdisciplinaryareaofbiologyandinformationsciences.TheI;sequencingofthehumangenomeandthedevelopmentofvarioushigh-throughputexperimentalI:technologiesmakebiologicaldatacontinuetoincreaseexponentially.BioinformaticsplaysakeyI;roleinhandling,integratingandminingthesedatatosolveimportantbiologicalquestionsandI;elucidatenewbiologicalrules.I: MicroRNAs(miRNAs)areaclassofrecentlyidentifiedsmallnon-codingRNAs.ThesetinyI;moleculesreceivedwideattentionduetotheirimportantregulatoryrolesinvariousbiologicalI;processesandpotentialapplicationsindiagnosisandtreatmentofhumandiseases.TheapplicationI:ofbioinformaticsinmiRNAresearchgreatlypromotesthedevelopmentandbriskprogressofthis;cutting-edgeareaofcurrentbiology.Inthisdissertation,IstudiedmiRNAs'identification,theirI;evolutionarypropertiesandtranscriptionalregulationusingbioinformaticsapproaches.MyworkisI:mainlycomposedbythefollowingfourparts:I; (1)DevelopedahighperformancemiRNApredictionmethod,whichcanbeusedtoidentifyI;distantlyrelatedmiRNAhomologgenes.I: IdentificationofmiRNAsisthefirststepinmiRNAfunctionalstudies.WhenwestartedthisI;work,onlyhighlyexpressedmiRNAshadbeendetectedbybiologicalexperimentsduetoI;limitationsofthetechniques.Forfindingthoselow-expressionortissue-specificmiRNAgenes,I:computationalpredictionprovidesanefficientapproach.I;Homologuesearchiswidelyadoptedingeneprediction.SuchmethodscouldbeusedtorevealI;andannotatehomologsofknowngenes.BecausethematuremiRNAsequencesareshort( 22nt),I:sequencealignmenttoolscanonlyfindthenearly-perfectmatchesduetothelargenumberofI;irrelevanthits.Wenoticedthat,theprecursorofmiRNAs(pre-miRNA)hastoformahairpin-likeI;secondarystructuretobecorrectlyprocessedbytheenzymeDicertoreleasethematuremiRNAs.I:FordistantlyrelatedmiRNAhomologs,thepre-miRNAsmaydivergeinsequencebutkeepI;conservationinstructure.Takingtheadvantageofbothsequenceandstructureconservation,weI;proposedamethodcallmiRAligntodetectnewmiRNAsbasedonbothsequenceandstructureI:alignment.ExperimentsshowthisapproachhashighersensitivityandspecificitythanpreviouslyI;reportedhomologuesearchingmethods,andcouldbeusedtoidentifydistantlyrelatedmiRNAI;homologs.ThewebserviceofmiRAlignhasbeenclickedformorethantwohundredthousandTOC\o"1-5"\h\z;timessinceits publication. :I I: (2)StudiedtheevolutionarypatternsofmiRNAsinvertebrates,providedanewangleofview:I I:tounderstand thefunctionofmiRNAsduringtheevolution. :I I;Whenwestartedthiswork,littlewasknownabouttheevolutionarypropertiesofmiRNAs.:I I!MostmiRNAswerethoughttobephylogeneticallyconserved.UsingmiRAlign,wepredictedthe!I I!homologgenesofalltheknownmiRNAsinthesequencedvertebrategenomesandcharacterized!I I;thedistributionofmiRNAfamiliesineachspecies.WefoundthatrecentlygeneratedmiRNAs:I I:seemtoevolveneutrallyduringacertainperiodfollowingtheiremergence.Multiple :I I!lineage-specificexpansionswereobserved,whichwouldcontributetospecificfunctionsduring!I I;embryodevelopment.Homologouspre-miRNAsmayproducematureproductsfromtheopposite:I I!stemarmsfollowingtandemduplications,whichmayhaveimportantcontributiontomiRNA :I I:innovation.OurobservationsofmiRNAs'complicatedevolutionarypatternssupportthenotionthat:I I;thesekeyregulatorymoleculesmayplayveryactiverolesinevolutionandprovidedanewangleof:I I!viewtounderstandthefunctionofmiRNAs.Ourobservationsandhypothesizesweresupportedby!I I:recentliteraturereports. :I I; (3)StudiedthetranscriptionalregulatorymechanismofmiRNAsusingcomparativegenomic:I I:approaches,andproposedanew strategy that takes the advantageofbothalignment-basedand :I I!motif-basedmethodstoidentify cis-regulatory elements. ;I I;TheexpressionofmiRNAgenesisintensivelyregulated,andtranscriptionalcontrolplaysthe:I I:majoreffect.Thekeytostudygenetranscriptionalregulatorymechanismistofindoutthe :I I:transcriptionfactorbindingsites(TFBSs)ingenepromoterregionsandconstructthetranscriptional:I I;regulatorynetworks.Typically,TFBSsareshortanddegeneratenucleotidesequences.Searching:I I!TFBSsusingtheinformationofasinglegenomeislikelytoresultinaveryhighrateoffalse !I I!positivepredictions.Recently,thegenomesequencingofdiverseanimalandplantspeciesprovides!I I;researchersagreatopportunitytostudygenetranscriptionalregulationmechanismsthrough :I I!comparativegenomicapproaches.Inthisthesis,weproposedanewphylogeneticfootprinting !I I!strategythattakestheadvantageofbothalignment-basedandmotif-basedmethodstoidentifyand;I I;analyzeconservedDNAcis-regulatoryelements.Thismethodwassuccessfullyusedtoanalyzethe:I I:miRNAgenesintheDrosophilaspecies. :I I! (4)Wedevelopedanewgenecore-promoterpredictionmethodwhichcanaccuratelyidentify:I I;mostofthe knownmiRNApromoters. :I I!Thecorrectlocalizationofgenetranscriptionstartsiteandcore-promoterisimportantfor!I I!understanding thetranscriptionalregulationofgenes.TypicallyhumanmiRNAsarisefromlarge:I I;primarytranscripts(pri-miRNAs)whichareprocessedrapidlyinthenucleus.It'sdifficultto :I I:identifysuchdistaltranscriptionstartsitesthroughcurrentexperimentalprocedureslike5'RACE.:I I!Andinaddition,theDNAsequencealo

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
  • 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 人人文庫網(wǎng)僅提供信息存儲空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負(fù)責(zé)。
  • 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時也不承擔(dān)用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。

評論

0/150

提交評論