R語言學(xué)習(xí)之火山圖的繪制詳解_第1頁
R語言學(xué)習(xí)之火山圖的繪制詳解_第2頁
R語言學(xué)習(xí)之火山圖的繪制詳解_第3頁
R語言學(xué)習(xí)之火山圖的繪制詳解_第4頁
全文預(yù)覽已結(jié)束

下載本文檔

版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請進行舉報或認(rèn)領(lǐng)

文檔簡介

第R語言學(xué)習(xí)之火山圖的繪制詳解目錄火山圖輸入數(shù)據(jù)格式使用significant列繪制火山圖自動計算significant列繪制火山圖火山圖中標(biāo)記基因的名字

火山圖

火山圖用于展示基因表達差異的分布,橫軸為Log2FoldChange,越偏離中心差異倍數(shù)越大;縱軸為(-1)*Log10P_adjust,值越大差異越顯著。一般橫軸越偏離中心的點其縱軸值也會比較大,因此呈現(xiàn)火山噴發(fā)的形狀。

一步繪制火山圖

輸入數(shù)據(jù)格式

火山圖需要的數(shù)據(jù)格式如下(本文用到的數(shù)據(jù)文件名為volcano.txt,文末有下載鏈接,此處截取一部分作為例子,也可用來畫圖,只是數(shù)據(jù)少,效果不明顯)

id:不是必須的,但一般的軟件輸出結(jié)果中都會包含,表示基因名字。log2FoldChange:差異倍數(shù)的對數(shù),一般的差異分析輸出結(jié)果中也會給出對數(shù)處理的值,因此程序沒有提供這一步的計算操作。padj:多重假設(shè)檢驗矯正過的差異顯著性P值;一般的差異分析輸出結(jié)果為原始值,程序提供一個參數(shù)對其求取負(fù)對數(shù)。significant:可選列,標(biāo)記哪些基因是上調(diào)、下調(diào)、無差異;若無此列或未在參數(shù)中指定此列,默認(rèn)程序會根據(jù)padj列和log2FoldChange列根據(jù)給定的閾值自動計算差異基因,并作出不同顏色的標(biāo)記。label:可選列,一般用于在圖中標(biāo)記出感興趣的基因的名字。非-行的字符串都會標(biāo)記在圖上。

idlog2FoldChangepadjsignificantlabel

E000074.282380EHBIO_UPA

E00008-1.10360.476466843393901Unchanged-

E00009-0.2743681Unchanged-

E000104.623477.37606076333335e-103EHBIO_UP-

E000120.9739870.482982440163204Unchanged-

E00017-1.302050.000555693857439792Baodian_UPB

E000240.6176362.78047837287061e-13Unchanged-

E000331.486692.56000581595275e-60EHBIO_UP-

E00034-0.7837160.00341521725291801Unchanged-

E000362.015926.03136656016401e-06EHBIO_UPC

E00040-1.896574.73663890849056e-21Baodian_UP-

E00041-0.2681680.563429434558031Unchanged-

E000420.08610480.367700939634328Unchanged-

E00043-1.193281.42673872027352e-153Baodian_UP-

E00044-0.8879812.43067804654905e-26Unchanged-

E00047-0.6109415.51696648645932e-57Unchanged-

使用significant列繪制火山圖

#-f:指定輸入文件,格式如上

#-x:指定橫軸變量,值為輸入文件中與取過對數(shù)的變化倍數(shù)相關(guān)的列的名字

#-y:指定縱軸變量,值為輸入文件中與P-value

#(也可能是p-adj,是否取過對數(shù)都可以)相關(guān)的列的名字

#-P:若為TRUE,則表示對-y指定的列進行-log10轉(zhuǎn)換

#-L:指定圖例的位置

#-s:指定差異基因列

#-S:指定差異基因列不同的標(biāo)簽出現(xiàn)的順序

sp_volcano.sh-fvolcano.txt-xlog2FoldChange-ypadj-ssignificant-S"'EHBIO_UP','Baodian_UP','Unchanged'"-PTRUE-Ltop

這個圖看上去還可以,沒有太大的問題。但有部分點與最頂端的線重合了,這些點的pvalue為0,取負(fù)對數(shù)后為負(fù)無窮。另外在一些情況下,會存在部分基因的pvalue極小,使得整張圖呈現(xiàn)一個壓縮的趨勢,大部分點偏安于圖的下方,中間大段空白,最上面零星幾個點。為了避免這種情況,程序設(shè)置了參數(shù)-M用于設(shè)定pvalue的最大的負(fù)對數(shù),所有大于給定值的數(shù),都會視為給定值。

#-M10:指定P-value(也可能是p-adj);若小于10^(-10),則為10^(-10)

#用于部分p-value存在異常值,導(dǎo)致整個圖都被壓縮在最底部

p_volcano.sh-fvolcano.txt-xlog2FoldChange-ypadj-ssignificant-S"'EHBIO_UP','Baodian_UP','Unchanged'"-PTRUE-Ltop-M10

注意看縱軸的變化,和最上面排成一條線的一堆點。

自動計算significant列繪制火山圖

若不存在significant列,程序會根據(jù)-F指定的參數(shù)計算并標(biāo)記差異基因。-F的默認(rèn)值為0.05,1(引號是必須的),第一個數(shù)表示pvalue或padj,對應(yīng)于-y列;第二個數(shù)表示對數(shù)轉(zhuǎn)換的差異倍數(shù),對應(yīng)于-x列。

#-F"0.05,1",默認(rèn)值,故命令行中未寫,引號是必須的

sp_volcano.sh-fvolcano.txt-xlog2FoldChange-ypadj-PTRUE-Ltop

#-M10:與之前相同

sp_volcano.sh-fvolcano.txt-xlog2FoldChange-ypadj-PTRUE-Ltop-M10

火山圖中標(biāo)記基因的名字

#-l:label,在圖中標(biāo)記部分基因的名字;

#label為含有待標(biāo)記基因名字的列名,此列中非-的非空字符都會視為基因名字

sp_volcano.sh-fvolcano.txt-xlog2FoldChange-ypadj-PTRUE-Ltop-M10-llabel

label列中

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
  • 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 人人文庫網(wǎng)僅提供信息存儲空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負(fù)責(zé)。
  • 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時也不承擔(dān)用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。

評論

0/150

提交評論