數(shù)量性狀的分子標(biāo)記(QTL定位的原理和方法講義).doc_第1頁
數(shù)量性狀的分子標(biāo)記(QTL定位的原理和方法講義).doc_第2頁
數(shù)量性狀的分子標(biāo)記(QTL定位的原理和方法講義).doc_第3頁
數(shù)量性狀的分子標(biāo)記(QTL定位的原理和方法講義).doc_第4頁
數(shù)量性狀的分子標(biāo)記(QTL定位的原理和方法講義).doc_第5頁
已閱讀5頁,還剩17頁未讀, 繼續(xù)免費閱讀

下載本文檔

版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請進行舉報或認(rèn)領(lǐng)

文檔簡介

數(shù)量性狀的分子標(biāo)記(QTL定位的原理和方法講義)作物中大多數(shù)重要的農(nóng)藝性狀和經(jīng)濟性狀如產(chǎn)量、品質(zhì)、生育期、抗逆性等都是數(shù)量性狀。與質(zhì)量性狀不同,數(shù)量性狀受多基因控制,遺傳基礎(chǔ)復(fù)雜,且易受環(huán)境影響,表現(xiàn)為連續(xù)變異,表現(xiàn)型與基因型之間沒有明確的對應(yīng)關(guān)系。因此,對數(shù)量性狀的遺傳研究十分困難。長期以來,只能借助于數(shù)理統(tǒng)計的手段,將控制數(shù)量性狀的多基因系統(tǒng)作為一個整體來研究,用平均值和方差來反映數(shù)量性狀的遺傳特征,無法了解單個基因的位置和效應(yīng)。這種狀況制約了人們在育種中對數(shù)量性狀的遺傳操縱能力。分子標(biāo)記技術(shù)的出現(xiàn),為深入研究數(shù)量性狀的遺傳基礎(chǔ)提供了可能??刂茢?shù)量性狀的基因在基因組中的位置稱為數(shù)量性狀基因座(QTL)。利用分子標(biāo)記進行遺傳連鎖分析,可以檢測出QTL,即QTL定位(QTL mapping)。借助與QTL連鎖的分子標(biāo)記,就能夠在育種中對有關(guān)的QTL的遺傳動態(tài)進行跟蹤,從而大大增強人們對數(shù)量性狀的遺傳操縱能力,提高育種中對數(shù)量性狀優(yōu)良基因型選擇的準(zhǔn)確性和預(yù)見性。因此,QTL定位是一項十分重要的基礎(chǔ)研究工作。1988年,Paterson等發(fā)表了第一篇應(yīng)用RFLP連鎖圖在番茄中定位QTL的論文。之后,隨著分子標(biāo)記技術(shù)的不斷發(fā)展以及許多物種中分子連鎖圖譜的相繼建成,全世界出現(xiàn)了研究QTL的熱潮,每年發(fā)表有關(guān)QTL研究的論文數(shù)量幾乎呈指數(shù)增長(圖5.1),顯示了該研究領(lǐng)域的勃勃生機。目前, QTL定位研究已在許多重要作物中展開,并且進展迅速。本章主要介紹QTL定位的原理和方法。圖5.119861998年期間國際上每年發(fā)表有關(guān)QTL研究的論文的數(shù)量. 數(shù)據(jù)從英國BIDS信息系統(tǒng)檢索得到第一節(jié) 數(shù)量性狀基因的初級定位QTL定位就是檢測分子標(biāo)記(下面將簡稱為標(biāo)記)與QTL間的連鎖關(guān)系,同時還可估計QTL的效應(yīng)。QTL定位研究常用的群體有F2、BC、RI和DH。這些群體可稱為初級群體(primary population)。用初級群體進行的QTL定位的精度通常不會很高,因此只是初級定位。由于數(shù)量性狀是連續(xù)變異的,無法明確分組,因此QTL定位不能完全套用孟德爾遺傳學(xué)的連鎖分析方法,而必須發(fā)展特殊的統(tǒng)計分析方法。80年代末以來,這方面的研究十分活躍,已經(jīng)發(fā)展了不少Q(mào)TL定位方法。一、QTL定位的基本原理和方法孟德爾遺傳學(xué)分析非等位基因間連鎖關(guān)系的基本方法是,首先根據(jù)個體表現(xiàn)型進行分組,然后根據(jù)各組間的比例,檢驗非等位基因間是否存在連鎖,并估計重組率。QTL定位實質(zhì)上就是分析分子標(biāo)記與QTL之間的連鎖關(guān)系,其基本原理仍然是對個體進行分組,但這種分組是不完全的。根據(jù)個體分組依據(jù)的不同,現(xiàn)有的QTL定位方法可以分成兩大類。一類是以標(biāo)記基因型為依據(jù)進行分組的,稱為基于標(biāo)記的分析法(marker-based analysis; Soller and Beckmann 1990);另一類是以數(shù)量性狀表型為依據(jù)進行分組的,稱為基于性狀的分析法(trait-based analysis;Keightley and Bulfield 1993)。(一)基于標(biāo)記的分析法如果某個標(biāo)記與某個QTL連鎖,那么在雜交后代中,該標(biāo)記與QTL之間就會發(fā)生一定程度的共分離,于是,在該標(biāo)記的不同基因型中,QTL的基因型頻率分布(分離比例)將不同(圖5.2),因而在該標(biāo)記的不同基因型之間,在數(shù)量性狀的分布、均值和方差上都存在差異?;跇?biāo)記的分析法正是通過檢驗標(biāo)記的不同基因型之間的這些差異來推知標(biāo)記是否與QTL連鎖的。在分子標(biāo)記技術(shù)出現(xiàn)之前提出的基于標(biāo)記的分析法主要是針對單標(biāo)記分析的,即每次只分析一個標(biāo)記,這是因為當(dāng)時可利用的遺傳標(biāo)記(主要是形態(tài)標(biāo)記和生化標(biāo)記)數(shù)量稀少,難以在一個試驗群體中建立起完整的標(biāo)記連鎖圖譜。隨著高密度分子標(biāo)記連鎖圖譜的出現(xiàn),單標(biāo)記分析方法暴露出了不能充分利用分子標(biāo)記圖譜所提供的遺傳信息的缺點。為了能更好地挖掘分子標(biāo)記圖譜的潛力,更多、更準(zhǔn)確地定位出QTL,科學(xué)家們相繼開發(fā)出了許多新的QTL定位方法,總的趨勢是朝著多標(biāo)記分析(即同時用多個標(biāo)記進行分析)的方向發(fā)展。根據(jù)所采用的統(tǒng)計遺傳模型,現(xiàn)有的基于標(biāo)記的分析方法大體上可分成四類,即:均值差檢驗法、性狀標(biāo)記回歸法、性狀QTL回歸法及性狀QTL標(biāo)記回歸法。這些方法的原理將在后面分別介紹。圖5.2DH群體中某QTL的基因型QQ和qq在連鎖標(biāo)記基因型MM和mm中的頻率分布(分離比例). r為標(biāo)記與QTL間的重組率. 僅當(dāng)r = 0.5(亦即標(biāo)記與QTL間沒有連鎖)時, QQ和qq在MM和mm中的頻率分布才相同(二)基于性狀的分析法雖然數(shù)量性狀在一個分離群體(如DH群體)中是連續(xù)變異的,但如果淘汰大多數(shù)中間類型,則高值和低值兩種極端表型的個體就可以明確地區(qū)分開來,分成兩組。對每個QTL而言,在高值表型組中應(yīng)存在較多的高值基因型(如QQ),而低值組中應(yīng)存在較多的低值基因型(如qq;圖5.3)。如果某個標(biāo)記與QTL有連鎖,那么,該標(biāo)記與QTL之間就會發(fā)生一定程度的共分離,于是其基因型分離比例(頻率分布)在兩組中都會偏離孟德爾規(guī)律(圖5.3)。用卡平方測驗方法對兩組或其中一組檢驗這種偏離,就能推斷該標(biāo)記是否與QTL連鎖。圖5.3基于性狀的分析法和分離體分組混合分析法的原理. 在DH群體中,與QTL連鎖的遺傳標(biāo)記的兩種基因型的分離比例在高值組和低值組中都會偏離1 : 1的孟德爾分離規(guī)律,其電泳帶型在高值組DNA和低值組DNA間也會表現(xiàn)出差異, 且分別與高值親本和低值親本相似還有一種更簡單的做法,就是將高值和低值兩組個體的DNA分別混合,形成兩個DNA池,然后檢驗兩池間的遺傳多態(tài)性。在兩池間表現(xiàn)出差異的分子標(biāo)記即被認(rèn)為與QTL連鎖(圖5.3)。這種方法稱為分離體分組混合分析法(BSA法;Darvasi and Soller 1994;參見第4章)?;谛誀畹姆治龇椒ǎㄌ貏e是BSA法)的突出優(yōu)點是,可以大幅度減少需要檢測的DNA樣品的數(shù)量,從而降低分子標(biāo)記分析的費用。它特別適合于對一些抗性(包括抗病、抗蟲、抗逆)性狀的基因定位,這是因為,抗性鑒定試驗常常造成敏感個體(基因型)的死亡,只有具有抗性的個體才能夠存活,于是只能對表現(xiàn)抗的極端個體進行分子標(biāo)記分析,這正好符合基于性狀的分析法。基于性狀的分析法的缺點是,它只能用于單個性狀的QTL定位,且靈敏度和精確度都較低,一般只能檢測出效應(yīng)較大的QTL。因此,基于性狀的分析法目前用得不多,主要還是采用基于標(biāo)記的分析法。下面著重對基于標(biāo)記的分析法進行介紹。二、均值差檢驗法均值差檢驗法的基本思想是檢驗同一標(biāo)記座位上不同基因型間數(shù)量性狀均值的差異,若差異顯著,則表明被檢標(biāo)記與QTL連鎖。單標(biāo)記均值差檢驗法包括t測驗法(Simpson 1989)和方差分析法(Soller et al. 1976; 李維明等 1993)。凡是每個標(biāo)記只有兩種基因型的群體(包括BC、DH、RI)都可以使用t測驗法。以DH群體為例,由圖5.2可知,當(dāng)某個標(biāo)記與一個QTL連鎖時,兩種標(biāo)記基因型(MM和mm)的性狀均值(mMM和mmm)分別為: (5.1) (5.2)式中,mQQ和mqq分別是QTL基因型QQ和qq的表型均值,r為標(biāo)記與QTL間的重組率。比較式(5.1)和(5.2)可以看出,僅當(dāng)r = 0.5,亦即標(biāo)記與QTL沒有連鎖時,才有mMM = mmm();而只要r 0.5,亦即標(biāo)記與QTL間存在連鎖,則總有mMM mmm。而且,r值越小,標(biāo)記與QTL間連鎖越緊密,則mMM與mmm之間的差異就越大。當(dāng)r = 0,亦即標(biāo)記與QTL之間完全連鎖時,標(biāo)記基因型間的均值差異達到最大,這時有mMM - mmm = mQQ - mqq。因此,用t測驗方法檢驗兩種標(biāo)記基因型間的數(shù)量性狀表型均值差異是否顯著,就能推斷該標(biāo)記是否與QTL連鎖。t值越大,即顯著性越高,則連鎖越緊密。如果群體中每個標(biāo)記存在3種基因型(如F2群體),或者盡管群體中每個標(biāo)記只有兩種基因型(如DH、RI群體),但試驗中設(shè)置了重復(fù)(李維明等 1993),則可以采用方差分析的方法來檢測標(biāo)記與QTL之間的連鎖關(guān)系。以F2群體為例。假設(shè)某個標(biāo)記與一個QTL連鎖,采用與圖5.2類似的推導(dǎo)方法,可以得到3種標(biāo)記基因型的性狀均值分別為: (5.3) (5.4) (5.5)式中所用符號的含義與式(5.1)和(5.2)的相似。比較式(5.3) (5.5),可以看出,與上面DH群體的情形相似,僅當(dāng)標(biāo)記與QTL間的重組率為,亦即標(biāo)記與QTL間沒有連鎖時,才有mMM = mMm = mmm();而只要r 0.5,亦即標(biāo)記與QTL間存在連鎖,則總有mMM mMm mmm。因此,用單因素方差分析法檢驗3種標(biāo)記基因型間的性狀均值差異是否顯著,就能推知該標(biāo)記是否與QTL連鎖。標(biāo)記與QTL間連鎖越緊密,則標(biāo)記基因型間均值的差異就越大,方差分析中F測驗得到的F值也越大(即顯著性越高)。單標(biāo)記均值差檢驗法的優(yōu)點是簡單直觀。一般而言,標(biāo)記離QTL越近,它與QTL間的重組率就越小,則其t值或F值就越大;反之,標(biāo)記離QTL越遠,它與QTL間的重組率就越大,則其t值或F值就越小。因此,根據(jù)染色體上各個標(biāo)記的t值或F值的大小,可以大致判斷出QTL的位置。但是,單標(biāo)記均值差檢驗法不能估計QTL的具體位置和效應(yīng),靈敏度較低,且一般不適用于一條染色體上存在多個QTL的情形。當(dāng)兩個QTL呈相引連鎖(即兩增效基因連鎖在一起或兩減效基因連鎖在一起)且相距不太遠時,由于兩QTL的效應(yīng)相互累加,可能會使得位于兩QTL之間的標(biāo)記表現(xiàn)出最大的t值或F值,從而導(dǎo)致無法識別那兩個真實QTL,卻錯誤地認(rèn)為在它們之間的某個位置上存在一個QTL。這個推斷出的QTL顯然是虛假的,是一個“幻影QTL”(ghost QTL)。相反,當(dāng)兩個QTL呈相斥連鎖(即一個增效基因與一個減效基因連鎖在一起)且相距不太遠時,由于兩QTL的效應(yīng)相互抵消,可能會使得兩QTL附近的標(biāo)記表現(xiàn)出很小的t值或F值,從而無法檢測出這兩個QTL。由于這些局限性,目前單標(biāo)記均值差檢驗法僅用于對數(shù)據(jù)的初步分析。對單標(biāo)記均值差檢驗法的一種改進方法,是將同一條染色體上各標(biāo)記的t測驗或方差分析聯(lián)合于一個回歸分析之中,稱為聯(lián)合定位法(joint mapping;Wu and Li 1994, 1996a, b)。下面以DH群體為例來說明聯(lián)合定位法的原理,它也適用于BC和RI群體。至于F2群體的聯(lián)合定位法,讀者可參閱Wu 和 Li (1996b)。從式(5.1)和(5.2)可以得到: (5.6)令y = mMM - mmm,x = 1 2r,b = mQQ - mqq,則式(5.6)可寫成 (5.7)可以看出,式(5.7)形式上恰好是一個截距為零的一元線性回歸方程。假設(shè)Haldane作圖函數(shù)成立(參見第三章),則有 (5.8)或 (5.9)式中,zM和zQ分別是標(biāo)記和QTL在染色體上的位置,以厘摩(cM)為單位。在完整的標(biāo)記連鎖圖上,每個標(biāo)記的位置都是已知的。因此,在式(5.9)中,只有QTL的位置zQ是未知的。當(dāng)zQ值給定時,也就確定了。如果一條染色體上有個標(biāo)記,那么在zQ值給定的情況下,就有對觀察值:(yi, xi), i = 1, 2, , n。這樣,就能應(yīng)用最小二乘法配合方程(5.7)。沿著整條染色體以一定步長(如1 cM)改變zQ的值,必能找到某一點(),使方程(5.7)配合得最好(即剩余平方和RSS達到最?。粓D5.4)。那么,該點()即為QTL位置的估計值,而得到的回歸系數(shù)即為QTL效應(yīng)的估計值。需要指出的是,由于同一條染色體上的標(biāo)記互相連鎖,因而不同觀察值yi (i = 1, 2, , n)之間不是相互獨立的。因此,應(yīng)使用廣義最小二乘法來配合方程(5.7),才能獲得最小估計誤差。方程(5.7)可以推廣到一條染色體上存在多個(如個)QTL的情形(圖5.4),這時方程的形式為: (5.10)式中,bj為第j個QTL的效應(yīng)值;xj取決于標(biāo)記與第j個QTL的之間的圖距。只要染色體上有足夠多的標(biāo)記,用方程(5.10)原則上可以定位任意多個QTL。圖5.4QTL聯(lián)合定位的一個模擬例子. 連鎖圖上每隔10cM有一個標(biāo)記, 黑色三角形示QTL的真實位置, 剩余平方和曲線最低點為QTL的估計位置, 水平點線示, 它與每個QTL的剩余平方和曲線的兩個交點確定了該QTL位置的95%置信區(qū)間(引自Wu and Li 1996a)聯(lián)合定位法的優(yōu)點是綜合利用了一條染色體上所有標(biāo)記的遺傳信息,所以提高了靈敏度和精確度,并可同時估計多個QTL的位置和效應(yīng),而且與性狀分布無關(guān),適用范圍廣,計算簡單。不足之處是使用矩量(均值)而非原始觀察數(shù)據(jù),因而要求有較大的實驗群體。另外,聯(lián)合定位法對分子標(biāo)記圖譜質(zhì)量的要求較高,這是它在實際應(yīng)用中的主要限制因素。三、性狀-標(biāo)記回歸法性狀-標(biāo)記回歸法是將個體的數(shù)量性狀表型值對單個標(biāo)記(Soller et al. 1976)或多個標(biāo)記(Rodolphe and Lefort 1993)的基因型進行回歸分析。前者屬于單標(biāo)記分析的方法,可以看作是后者的一種特例,目前已很少使用。所以下面我們只需介紹性狀對多標(biāo)記回歸分析的方法。仍以DH群體為例。這時的多標(biāo)記的性狀-標(biāo)記回歸模型為: (5.11)式中,yi為第i個體的性狀值;m為模型均值;bj為第j標(biāo)記的偏回歸系數(shù);xij為第i個體第j標(biāo)記基因型的指示變量,依標(biāo)記基因型為MM或mm而取值1或0;m為標(biāo)記個數(shù);ei為隨機誤差。式(5.11)是一個多元線性回歸模型,可以用最小二乘法來配合。偏回歸系數(shù)的大小反映了各個標(biāo)記與數(shù)量性狀的相關(guān)程度。一般而言,如果某標(biāo)記的偏回歸達到顯著水平,則說明在該標(biāo)記附近可能存在QTL。但是,性狀-標(biāo)記回歸法通常不能給出QTL位置和效應(yīng)的估計值,除非QTL正好位于標(biāo)記座位上,這時的偏回歸系數(shù)就是QTL的效應(yīng)值。不過,根據(jù)各標(biāo)記回歸系數(shù)的顯著性,能夠大致判斷出可能存在QTL的染色體區(qū)域。值得提到的是,性狀-標(biāo)記回歸有一個有趣的統(tǒng)計特性。這就是,在回歸中,一個QTL的效應(yīng)只被其兩側(cè)相鄰標(biāo)記的偏回歸系數(shù)所吸收,而不會影響到該標(biāo)記區(qū)間之外的標(biāo)記。這一特性非常重要。后面我們將看到,這一特性對提高QTL定位的準(zhǔn)確性很有幫助。四、性狀-QTL回歸法性狀-QTL回歸法是將個體的數(shù)量性狀表型值對假設(shè)存在的某個或某些QTL的基因型進行回歸分析。以DH群體為例,單個QTL的回歸模型為: (5.12)式中,yi為第i個體的表型值;m為模型均值;b為QTL的效應(yīng);xi為第i個體的QTL基因型的指示變量,依QTL基因型為QQ或qq而取值1或0;ei為隨機誤差。由于被檢QTL的基因型是未知的,因而xi的值實際上是不確定的,或者說是“缺失”的。在這種情況下,只能根據(jù)與QTL連鎖的標(biāo)記的基因型來推斷xi為1或0的概率,并用似然比檢驗法來估計參數(shù)和檢驗回歸顯著性,即 (5.13)或 (5.14)其中L(b = 0)和L(b 0)分別表示b = 0和b 0時的最大似然值(注:LR與LOD之間存在轉(zhuǎn)換關(guān)系:LOD 0.217LR)。當(dāng)似然比統(tǒng)計量LR或LOD的值大于給定的顯著閾值時,則認(rèn)為,即假定的QTL的效應(yīng)不為零,因而可推斷QTL存在。早期的性狀-QTL回歸分析是利用單個連鎖標(biāo)記來推斷xi取值概率的,亦即屬于單標(biāo)記分析的方法(Simpson 1989),目前已很少使用。分子標(biāo)記技術(shù)出現(xiàn)之后,Lander和Botstein(1989)提出了更為準(zhǔn)確的方法,即用被檢QTL兩側(cè)相鄰的連鎖標(biāo)記來推斷xi取值的概率(表5.1),稱為區(qū)間定位法(interval mapping)。由表5.1可以看出,xi取值的概率取決于QTL與兩側(cè)相鄰標(biāo)記間的重組率或圖距。因此,以一定的步長(如1 cM),沿整條染色體逐步改變假設(shè)存在的QTL的位置,就能得到LOD(或LR)值沿染色體變化的曲線。大于顯著臨界值的LOD曲線高峰所對應(yīng)的染色體位置就是存在QTL可能性最大的位置(圖5.5)。表5.1在DH群體中用兩側(cè)相鄰標(biāo)記推斷QTL基因型概率及其指示變量的期望值標(biāo)記基因型QQQq期望值M1M1M2M2M1M1m2m2m1m1M2M2m1m1m2m2注:M1-m1和M2-m2分別為QTL左側(cè)和右側(cè)的相鄰標(biāo)記;、和分別為QTL與左側(cè)標(biāo)記和右側(cè)標(biāo)記之間及左、右兩標(biāo)記之間的重組率;,其中為符合系數(shù)圖5.5番茄第10號染色體上果實性狀QTL區(qū)間定位的一個例子. LOD曲線超過顯著閾值(水平線表示)的峰頂為QTL的估計位置. 虛線為果實pH值的LOD曲線,其高峰顯示了在染色體端部和中部各存在一個QTL. 下方兩條分別為果實重量和果實可溶固形物濃度的LOD曲線, 均沒顯示QTL的存在(引自Lynch and Walsh 1998)對模型(5.12)的最大似然估計需要進行迭代運算,所以計算上比較繁瑣費時。如果讓自變量xi取其期望值(表5.1),亦即使xi有個確定值,則模型(5.12)就可用最小二乘法進行配合(Haley and Knott 1992),從而使計算大為簡化、速度大為提高。為了便于與原來基于最大似然估計的區(qū)間定位法進行比較,在最小二乘估計中也可以用似然比來進行統(tǒng)計顯著性檢驗。這時的似然比統(tǒng)計量為: (5.15)其中n為樣本大?。▊€體數(shù))。研究表明,基于最小二乘估計的區(qū)間定位法與基于最大似然估計的區(qū)間定位法所得的結(jié)果非常接近(Haley and Knott 1992)。區(qū)間定位法提出后,得到了廣泛應(yīng)用,對QTL定位研究的發(fā)展起到了重要的推動作用。但區(qū)間定位法也存在明顯的缺點。當(dāng)一條染色體上同時存在一個以上的QTL時,區(qū)間定位法也會出現(xiàn)與前述單標(biāo)記均值差檢驗法相似的問題,或者檢測到“幻影QTL”(當(dāng)兩個QTL相引連鎖時),或者檢測QTL的靈敏度(統(tǒng)計功效)降低(當(dāng)兩個QTL為相斥連鎖時),這是因為它無法排除被檢區(qū)間之外的QTL對被檢區(qū)間的影響。為克服區(qū)間定位法的缺點,不少學(xué)者提出了改進意見。Haley和Knott(1992)建議同時對多個可能存在的QTL(標(biāo)記區(qū)間)進行回歸分析,這時的回歸模型形式上與(5.11)相同,但其自變量是QTL而非標(biāo)記,其基因型指示變量xij也取期望值。該方法的缺點是,必須確定染色體上到底有多少個可能存在的QTL,這往往并不容易,因而在回歸模型的選擇上帶有較大的任意性。另外,配合包含多個QTL的回歸模型需要進行多維搜索,這也增加了計算上的難度。Moreno-Gonzalez(1992)提出了另一種方法,先假定所有標(biāo)記區(qū)間都包含一個QTL,且位于區(qū)間的中點,然后通過逐步回歸分析篩選出偏回歸顯著的標(biāo)記區(qū)間(QTL)。顯然,僅當(dāng)分子標(biāo)記圖譜較密且標(biāo)記在染色體上分布較均勻時,這種方法才可能是有效的。五、性狀-QTL-標(biāo)記回歸法對區(qū)間定位法最有效的改進方法是將它與多標(biāo)記的性狀-標(biāo)記回歸法相結(jié)合。根據(jù)性狀-標(biāo)記回歸中每個QTL的效應(yīng)只被其兩側(cè)相鄰標(biāo)記所吸收的統(tǒng)計特性,可以用被檢區(qū)間以外的部分(Jansen 1993; Zeng 1994)或全部(Zeng 1994)標(biāo)記作為回歸模型中的余因子(cofactor)來消除其它QTL或遺傳背景對被檢區(qū)間的影響。根據(jù)這一思想,Jansen(1993)和Zeng(1994)分別提出了多QTL模型(multiple-QTL model)和復(fù)合區(qū)間定位法(composite interval mapping),其中復(fù)合區(qū)間定位法由于直觀性較好、計算上易于自動化而被普遍接受和廣泛應(yīng)用,已逐步取代區(qū)間定位法。這里仍以DH群體為例,其復(fù)合區(qū)間定位的統(tǒng)計模型為: (5.16)式中,和分別為被檢QTL的效應(yīng)和基因型指示變量相當(dāng)于式(5.12)中的b和xi,其它符號的含義與式(5.11)相同。必須注意的是,模型(5.16)中不一定要包含全部的標(biāo)記。根據(jù)前面提到的性狀-標(biāo)記回歸的統(tǒng)計特性,理論上只需將可能與QTL相鄰因而擁有信息的標(biāo)記納入模型中就可以了,這樣可增加回歸分析的自由度,提高參數(shù)估值的準(zhǔn)確性。這些作為余因子的標(biāo)記可以通過用模型(5.11)進行逐步回歸分析或其它方法獲得的先驗知識來選擇。不難看出,模型(5.16)實際上是模型(5.11)和(5.12)混合而成的,所以復(fù)合區(qū)間定位的模型配合和顯著性測驗與區(qū)間定位是基本相似的,其似然比檢驗為 (5.17)式中符號含義與(5.13)相似。圖5.6給出了一個應(yīng)用復(fù)合區(qū)間定位法定位QTL的例子??梢钥闯?,與區(qū)間定位法相比,復(fù)合區(qū)間定位法大大提高了QTL定位的精確度,這是復(fù)合區(qū)間定位方法的突出優(yōu)點。然而,復(fù)合區(qū)間定位法對QTL定位精確度的提高是以降低靈敏度(統(tǒng)計功效)為代價的,這是因為與被檢標(biāo)記區(qū)間相鄰的作為余因子的標(biāo)記會部分吸收被檢區(qū)間中QTL的效應(yīng)。因此,與被檢區(qū)間靠得太近的標(biāo)記不宜作為余因子。為了解決這個問題,可以在被檢區(qū)間的兩側(cè)各開設(shè)一個“窗口”,只有在該窗口之外的標(biāo)記才能選作余因子。由于不同的被檢區(qū)間所要求的合適的窗口寬度可能是不同的,因此在實際應(yīng)用中,應(yīng)嘗試使用多種窗口寬度,以尋找各個被檢區(qū)間所適合的窗口寬度。圖5.6老鼠X染色體上體重QTL定位的一個例子. 區(qū)間定位的LOD曲線(虛線)表現(xiàn)為一個很寬的峰, 而復(fù)合區(qū)間定位的LOD曲線(實線)則顯示兩個單獨的峰. Bw1和Bw2表示兩個可能存在的QTL, 染色體上的黑點示標(biāo)記的位置(引自Lynch and Walsh 1998)由于復(fù)合區(qū)間定位的回歸模型的參數(shù)較多,其計算量比區(qū)間定位大大增加。為了簡化復(fù)合區(qū)間定位的計算,可以采取與區(qū)間定位法相似的做法,令被檢QTL的基因型指示變量取其期望值,這樣就可以應(yīng)用最小二乘法來配合回歸模型(Wu et al. 1996b)?;谧钚《说膹?fù)合區(qū)間定位的似然比統(tǒng)計量為: (5.18)其中m為余因子標(biāo)記的數(shù)量,其它符號含義與(5.15)相似。復(fù)合區(qū)間定位法最初是針對大樣本情況提出來的。但在實際研究中,所用的實驗群體往往都不很大。在小樣本(特別是個體數(shù)少于標(biāo)記數(shù))的情況下,復(fù)合區(qū)間定位所需的余因子的選擇會發(fā)生困難,為了保證足夠大的回歸自由度,選用的余因子不能太多,而余因子選擇的不同又會影響QTL定位的結(jié)果。因此,在小樣本情況下如何進行復(fù)合區(qū)間定位是一個需要解決的問題。一種比較可行的策略是(Wu et al. 1999),考慮到各條染色體在遺傳上(因而在統(tǒng)計上)是相互獨立的,因而可以對每條染色體(而非整個基因組)分別進行復(fù)合區(qū)間定位。不過,在小樣本中,由于抽樣誤差,不同染色體之間還是可能存在相關(guān)性的。因此,在完成復(fù)合區(qū)間定位之后,最好再用逐步回歸分析的方法對所有檢測出的QTL進行重新評估,以排除假陽性(Wu et al. 1999)。復(fù)合區(qū)間定位法可以推廣到多性狀分析的情形(Jiang and Zeng 1995),稱為多性狀復(fù)合區(qū)間定位法(multiple-trait composite interval mapping)。多性狀復(fù)合區(qū)間定位法利用了不同性狀間相關(guān)的遺傳信息,因而具有比(單性狀的)復(fù)合區(qū)間定位法更多的優(yōu)點:(1)可以提高QTL定位的靈敏度和精確度;(2)可以用來鑒別QTL的緊密連鎖和多效性;(3)可以用來分析多年多點試驗數(shù)據(jù),檢測QTL與環(huán)境間的相互作用。為了提高計算速度,與(單性狀的)復(fù)合區(qū)間定位法的情況相似,多性狀復(fù)合區(qū)間定位模型也可以用最小二乘法來配合(Wu et al. 1999)。新近還提出了基于混合線性模型(即同時包含固定效應(yīng)和隨機效應(yīng)的線性模型)的復(fù)合區(qū)間定位方法(mixed-model-based composite interval mapping;Zhu and Weir 1998)。這種方法的優(yōu)點是減少了回歸自由度對復(fù)合區(qū)間定位的限制,能夠用來估計QTL的上位性效應(yīng)(即不同等位基因間的互作效應(yīng))和QTL與環(huán)境的互作效應(yīng),從而拓展了復(fù)合區(qū)間定位法的應(yīng)用范圍。不過,這種方法在檢測QTL上位性效應(yīng)時,必須在基因組上進行二維搜索,因而計算上比較復(fù)雜。六、基于性狀-標(biāo)記回歸的區(qū)間定位前面已提到,在性狀-標(biāo)記回歸中,每個QTL的效應(yīng)只被其兩側(cè)相鄰標(biāo)記所吸收。Whittaker等(1996)證明,在只有加性效應(yīng)的情況下,性狀-標(biāo)記回歸與基于最小二乘的復(fù)合區(qū)間定位法具有等價性,當(dāng)兩個相鄰標(biāo)記的回歸系數(shù)同號(即同為正或負)時,能夠計算出位于它們之間的QTL的位置和效應(yīng)。以DH群體為例,從模型(5.11)出發(fā),當(dāng)某個標(biāo)記區(qū)間(k, k+1)中存在一個QTL時,則區(qū)間兩端標(biāo)記的偏回歸系數(shù)(bk和bk+1)將同號,并且有 (5.19) (5.20)式中,rk為第k(即區(qū)間左端)標(biāo)記與QTL間的重組率,r為兩標(biāo)記間的重組率,a為QTL的加性效應(yīng)。可見,從相鄰標(biāo)記的偏回歸系數(shù)就足以求出標(biāo)記區(qū)間內(nèi)QTL的位置和效應(yīng)。但是,僅根據(jù)標(biāo)記的偏回歸系數(shù)還不足以確定某個標(biāo)記區(qū)間中是否存在QTL。為此,我們可以采取與復(fù)合區(qū)間定位法相似的方法,用似然比統(tǒng)計量來檢驗?zāi)硞€標(biāo)記區(qū)間中QTL是否存在(吳為人等2000),其似然比統(tǒng)計量為:(5.21)式中符號含義與(5.18)相似。利用式(5.21)可以計算出每個標(biāo)記區(qū)間的似然比值,從而可以非常直觀地判斷出哪個區(qū)間內(nèi)可能存在QTL。研究表明,這種性狀-標(biāo)記回歸區(qū)間定位法的QTL定位結(jié)果與基于最小二乘的復(fù)合區(qū)間定位法完全相同,但它無需進行全基因組逐點掃描,因而其計算速度極快。因此,在只有加性效應(yīng)的情況下,完全可以用性狀-標(biāo)記回歸區(qū)間定位法來代替復(fù)合區(qū)間定位,以節(jié)約大量的計算時間。七、QTL定位的計算機軟件從上面的介紹可以看出,QTL定位涉及到相當(dāng)復(fù)雜的統(tǒng)計計算,并需要處理大量的數(shù)據(jù),這些工作都必須靠計算機來完成。因此,為了便于從事實際QTL定位研究的遺傳育種學(xué)家分析他們的試驗結(jié)果,將各種QTL定位方法編制成通用的計算機軟件是十分必要的。第一個推廣發(fā)行的QTL分析通用軟件是Mapmaker/QTL,它是針對區(qū)間定位法而設(shè)計的。該軟件的發(fā)行,大大促進了區(qū)間定位方法的實際應(yīng)用。此后,陸續(xù)開發(fā)出了許多QTL分析軟件,如QTL Cartographer、PLABQTL、Map Manager、QGene、MapQTL等。許多QTL分析軟件都可以從因特網(wǎng)上查尋到并免費下載。通過由美國Wisconsin-Madison大學(xué)建立的一個WWW連接網(wǎng)站(/biosci/linkage.html)可以很方便地連接到許多QTL定位分析軟件包。但到目前為止,還沒有推出一套中文版的QTL分析軟件。為了促進我國的作物QTL定位研究的發(fā)展,“九五”期間,863計劃作物分子標(biāo)記輔助育種專題項目開展了中文版的QTL分析通用軟件編制工作。該軟件稱為“QTL工具箱”(QTL KIT),目前已完成第一版,可以提供給我國廣大從事QTL定位工作的研究人員試用,并還將不斷補充和完善。八、QTL定位的可靠性隨著QTL定位研究在各種作物中的廣泛開展,人們對QTL定位的可靠性越來越關(guān)注。根據(jù)已有的研究報道看,盡管不同研究者所使用的實驗材料和群體不同,但對同一性狀的研究結(jié)果還是有相符之處的,特別是一些效應(yīng)較大的QTL,確實能在不同的實驗群體中被檢測出來,而且定出的位置也比較相近。這說明QTL定位具有一定的可靠性。吳為人課題組對水稻細菌性條斑病抗性QTL的研究結(jié)果為QTL定位的可靠性提供了有力的證據(jù)。該研究用同一個高感品種 高抗品種雜交組合(H359 Acc8558),建立了RI和F2兩個獨立的實驗群體,并利用RI群體構(gòu)建該組合的分子標(biāo)記(RFLP和AFLP)連鎖圖譜。對RI群體進行了連續(xù)兩年的抗性鑒定試驗,對所得數(shù)據(jù)應(yīng)用復(fù)合區(qū)間定位方法進行分析,發(fā)現(xiàn)了5個在兩年試驗中都表現(xiàn)出較大效應(yīng)的QTL。對F2群體則采用BSA法進行分析,共檢測到3個QTL。有趣的是,這3個QTL正好包含在從RI群體中發(fā)現(xiàn)的那5個效應(yīng)較大的QTL中。該研究針對同一個雜交組合,采用不同的群體(一個為永久性群體RI;另一個為暫時性群體F2)和不同的分析方法(一種為統(tǒng)計學(xué)方法,即復(fù)合區(qū)間定位法;另一種為生物學(xué)方法,即BSA法),定位出相同的QTL。這有力地證明了QTL的真實存在性,同時也說明,至少對效應(yīng)較大的QTL來說,定位的結(jié)果一般是可靠的。許多計算機模擬研究也都表明,只要QTL能被檢測出(即達到統(tǒng)計顯著水平),則對它的位置估計一般都是比較可靠的,定位結(jié)果一般能夠用于標(biāo)記輔助育種(何小紅等 2000)。當(dāng)然,由于受實驗群體的限制,QTL初級定位的精確度是有限的,存在較大的置信區(qū)間。若要更準(zhǔn)確地定位QTL,則必須進行精細定位(參見下一節(jié))。九、提高QTL定位靈敏度和精確度的方法一個QTL的存在是通過它的表型效應(yīng)體現(xiàn)出來的。因此,一個QTL的效應(yīng)就象它發(fā)出的一種“信號”,通過接收該信號就能獲知它的存在。然而,一個QTL的效應(yīng)并不是孤立存在的,而是混雜在遺傳背景(其它QTL)和環(huán)境的效應(yīng)之中。遺傳背景和環(huán)境的效應(yīng)就象“噪音”,干擾了信號(目標(biāo)QTL效應(yīng))的檢測。要提高QTL定位的靈敏度和精確度,就必須增強信號,減小噪音。選擇性基因型測定(selective genotyping)是增強信號(擴大QTL效應(yīng))的一種方法(Darvasi and Soller 1992)。其思想是,在一個群體中,選擇高、低兩種極端表型的個體構(gòu)成一個子群體,僅對該子群體測定個體的分子標(biāo)記基因型,用于QTL定位分析,以減少分子標(biāo)記分析的費用。雖然極端表型子群體的個體數(shù)遠少于原群體,但其QTL定位靈敏度和精確度卻可以不亞于原群體,因為在子群體中,QTL的效應(yīng)通常被擴大。以DH群體為例,從圖5.7可以看出,在原群體中,某QTL的效應(yīng)(兩種基因型間的差值)為mQQ - mqq;而在極端表型子群體中,該QTL的效應(yīng)變成,明顯增大。圖5.7選擇性基因型測定增大QTL效應(yīng)的原理. 實曲線示DH群體中某性狀的頻率分布, 兩虛曲線分別示某QTL兩種基因型QQ和qq的性狀頻率分布, 兩端豎線分別表示選擇高低極端表型個體的界限, 和分別為原群體中基因型QQ和qq的均值, 和分別為中選個體中基因型QQ和qq的均值(用黑色倒三角形指示)如前所述,QTL定位分析中的噪音有兩個來源,一個是遺傳背景,一個是環(huán)境。環(huán)境噪音(誤差)是隨機的,一般可以通過適當(dāng)?shù)脑囼炘O(shè)計(如設(shè)置重復(fù))來加以控制??刂七z傳背景噪音的方法有兩種,一種是實驗方法,從試驗材料進行控制(參見下一節(jié));另一種是數(shù)學(xué)方法,從統(tǒng)計上進行控制。例如,復(fù)合區(qū)間定位法就是利用被檢區(qū)間以外的標(biāo)記來消除其它QTL(遺傳背景)對被檢區(qū)間(QTL)的影響的?;谶@一原理,Wu等(1998)提出了消除遺傳背景噪音的一般方法。其思想是:先利用式(5.11)進行性狀-標(biāo)記回歸分析(可以是一般的多元回歸分析,模型包括所有的標(biāo)記;也可以是逐步回歸分析,模型最后只包括回歸顯著的標(biāo)記),然后對每條(如第s條)染色體計算只包含其凈效應(yīng)的表型值: (5.22)式中,表示對位于第s染色體之外的全部或部分標(biāo)記求和??梢钥闯?,式(5.22)就象一個過濾器,它將其它染色體上的QTL(遺傳背景)的效應(yīng)濾去。這樣,對每條染色體上的QTL就可以用只包含該染色體凈效應(yīng)的表型數(shù)據(jù)進行定位分析,從而消除了遺傳背景噪音的干擾。這種方法可以與已有的所有QTL定位方法配合使用。 這種針對某條染色體濾除遺傳背景噪音的統(tǒng)計思想還可以延伸到只針對某個標(biāo)記區(qū)間的情況(吳為人等 2000)。這時式(5.22)仍然適用,只是其中s表示的是標(biāo)記區(qū)間(而非染色體)的序號,因而yi(s)是只包含第s區(qū)間凈效應(yīng)的表型值。用這種凈表型值對被檢區(qū)間進行QTL定位,可以顯著提高統(tǒng)計功效(靈敏度)。第二節(jié) 數(shù)量性狀基因的精細定位理論研究表明,影響QTL初級定位靈敏度和精確度的最重要因素還是群體的大小。但是,在實際研究中,限于費用和工作量,所用的初級群體不可能很大。而即使沒有費用和工作量的問題,一個很大的群體也會給田間試驗的具體操作和誤差控制帶來極大的困難。所以,使用很大的初級群體是不切合實際的。由于群體大小的限制,因此無論怎樣改進統(tǒng)計分析方法,也無法使初級定位的分辨率或精度達到很高,估計出的QTL位置的置信區(qū)間一般都在10 cM以上(Alpert and Tanksley 1996),不能確定檢測到的一個QTL中到底是只包含一個效應(yīng)較大的基因還是包含數(shù)個效應(yīng)較小的基因(Yano and Sasaki 1997)。也就是說,初級定位的精度還不足以將數(shù)量性狀確切地分解成一個個孟德爾因子。因此,為了更精確地了解數(shù)量性狀的遺傳基礎(chǔ),在初級定位的基礎(chǔ)上,還必須對QTL進行高分辨率(亞厘摩水平)的精細定位,亦即在目標(biāo)QTL區(qū)域上建立高分辨率的分子標(biāo)記圖譜,并分析目標(biāo)QTL與這些標(biāo)記間的連鎖關(guān)系。一、單個QTL的精細定位為了精細定位某個QTL,必須使用含有該目標(biāo)QTL的染色體片段代換系或近等基因系(簡稱為目標(biāo)代換系)與受體親本進行雜交,建立次級實驗群體。一個理想的染色體片段代換系應(yīng)該是,除了目標(biāo)QTL所在的染色體片段完整地來自供體親本之外,基因組的其余部分全部與受體親本相同(圖5.8)。這樣,在染色體片段代換系與受體親本雜交的后代中,僅在代換片段上存在基因分離,因而QTL定位分析只局限在很窄的染色體區(qū)域上,消除了遺傳背景變異的干擾,這就從遺傳和統(tǒng)計兩個方面保證了QTL定位的精確性。例如,日本水稻基因組研究計劃成功地應(yīng)用染色體片段代換系對一個水稻抽穗期主效QTL進行了精細定位,分辨率超過0.5 cM(Yamamoto et al. 1996)。圖5.8染色體片段代換系. 圖中僅畫出與受體親本有差異的染色體, 其余染色體的組成皆與受體親本相同精細定位目標(biāo)QTL的程序是:(1)將目標(biāo)代換系與受體親本雜交,建立僅在代換片段上發(fā)生基因分離的F2群體(次級群體);(2)調(diào)查F2群體中各單株的目標(biāo)(被研)性狀值(表現(xiàn)型);(3)篩選目標(biāo)代換系與受體親本間(在代換片段上)的分子標(biāo)記;(4)用篩選出的分子標(biāo)記測定F2各單株的標(biāo)記型(marker-type,即分子標(biāo)記的基因型);(5)聯(lián)合表現(xiàn)型數(shù)據(jù)和標(biāo)記型數(shù)據(jù)進行分析,估計出目標(biāo)QTL與標(biāo)記間的連鎖距離。在初級定位中所用的QTL定位方法均可用于精細定位中的數(shù)據(jù)分析。由于精細定位的精度達到亞厘摩水平( 1000)。染色體片段代換系一般通過多代回交來建立。在回交過程中,為了對目標(biāo)QTL所在的染色體區(qū)段進行選擇,先必須對該QTL進行初級定位,然后通過連鎖標(biāo)記進行跟蹤選擇,亦即進行標(biāo)記輔助選擇(詳見第六章)。很顯然,標(biāo)記輔助選擇的可靠性依賴于QTL初級定位的準(zhǔn)確性。因此,這種建立目標(biāo)染色體片段代換系的方法一般只適用于一些效應(yīng)大的QTL,因為只有效應(yīng)較大的QTL才能

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
  • 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 人人文庫網(wǎng)僅提供信息存儲空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負責(zé)。
  • 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時也不承擔(dān)用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。

評論

0/150

提交評論