


下載本文檔
版權(quán)說(shuō)明:本文檔由用戶(hù)提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請(qǐng)進(jìn)行舉報(bào)或認(rèn)領(lǐng)
文檔簡(jiǎn)介
1、ROC曲線(xiàn)指受試者工作特征曲線(xiàn) / 接收器操作特性曲線(xiàn)(receiver operating characteristic curve), 是反映敏感性和特異性連續(xù)變量的綜合指標(biāo),是用構(gòu)圖法揭示敏感性和特異性的相互關(guān)系,它通過(guò)將連續(xù)變量設(shè)定出多個(gè)不同的臨界值,從而計(jì)算出一系列敏感性和特異性,再以敏感性為縱坐標(biāo)、(1-特異性)為橫坐標(biāo)繪制成曲線(xiàn),曲線(xiàn)下面積越大,診斷準(zhǔn)確性越高。在ROC曲線(xiàn)上,最靠近坐標(biāo)圖左上方的點(diǎn)為敏感性和特異性均較高的臨界值。ROC曲線(xiàn)的例子考慮一個(gè)二分問(wèn)題,即將實(shí)例分成正類(lèi)(positive)或負(fù)類(lèi)(negative)。對(duì)一個(gè)二分問(wèn)題來(lái)說(shuō),會(huì)出現(xiàn)四種情況。如果一個(gè)實(shí)例是正類(lèi)
2、并且也被 預(yù)測(cè)成正類(lèi),即為真正類(lèi)(True positive),如果實(shí)例是負(fù)類(lèi)被預(yù)測(cè)成正類(lèi),稱(chēng)之為假正類(lèi)(False positive)。相應(yīng)地,如果實(shí)例是負(fù)類(lèi)被預(yù)測(cè)成負(fù)類(lèi),稱(chēng)之為真負(fù)類(lèi)(True negative),正類(lèi)被預(yù)測(cè)成負(fù)類(lèi)則為假負(fù)類(lèi)(false negative)。TP:正確肯定的數(shù)目;FN:漏報(bào),沒(méi)有正確找到的匹配的數(shù)目;FP:誤報(bào),給出的匹配是不正確的;TN:正確拒絕的非匹配對(duì)數(shù);列聯(lián)表如下表所示,1代表正類(lèi),0代表負(fù)類(lèi)。 預(yù)測(cè) 10合計(jì)實(shí)際1True Positive(TP)False Negative(FN)Actu
3、al Positive(TP+FN) 0False Positive(FP)True Negative(TN)Actual Negative(FP+TN)合計(jì) Predicted Positive(TP+FP)Predicted Negative(FN+TN)TP+FP+FN+TN從列聯(lián)表引入兩個(gè)新名詞。其一是真正類(lèi)率(true positive rate ,TPR), 計(jì)算公式為T(mén)PR=TP/ (TP+ FN),刻畫(huà)的是分類(lèi)器所識(shí)別出的 正實(shí)例占所有正實(shí)例的比例。另外一個(gè)是負(fù)正類(lèi)率(false positive rate, FPR),計(jì)算公式為FPR= FP /
4、 (FP + TN),計(jì)算的是分類(lèi)器錯(cuò)認(rèn)為正類(lèi)的負(fù)實(shí)例占所有負(fù)實(shí)例的比例。還有一個(gè)真負(fù)類(lèi)率(True Negative Rate,TNR),也稱(chēng)為specificity,計(jì)算公式為T(mén)NR=TN/ (FP+ TN) = 1-FPR。1 / 3其中,兩列True matches和True non-match分別代表應(yīng)該匹配上和不應(yīng)該匹配上的兩行Pred matches和Pred non-match分別代表預(yù)測(cè)匹配上和預(yù)測(cè)不匹配上的在一個(gè)二分類(lèi)模型中,對(duì)于所得到的連續(xù)結(jié)果,假設(shè)已確定一個(gè)閥值,比如說(shuō) 0.6,大于這個(gè)值的實(shí)例劃歸為正類(lèi),小于這個(gè)值則劃到負(fù)類(lèi)中。如果減小閥值,減到0.5,固然
5、能識(shí)別出更多的正類(lèi),也就是提高了識(shí)別出的正例占所有正例 的比類(lèi),即TPR,但同時(shí)也將更多的負(fù)實(shí)例當(dāng)作了正實(shí)例,即提高了FPR。為了形象化這一變化,在此引入ROC,ROC曲線(xiàn)可以用于評(píng)價(jià)一個(gè)分類(lèi)器。ROC曲線(xiàn)和它相關(guān)的比率(a)理想情況下,TPR應(yīng)該接近1,F(xiàn)PR應(yīng)該接近0。ROC曲線(xiàn)上的每一個(gè)點(diǎn)對(duì)應(yīng)于一個(gè)threshold,對(duì)于一個(gè)分類(lèi)器,每個(gè)threshold下會(huì)有一個(gè)TPR和FPR。比如Threshold最大時(shí),TP=FP=0,對(duì)應(yīng)于原點(diǎn);Threshold最小時(shí),TN=FN=0,對(duì)應(yīng)于右上角的點(diǎn)(1,1)(b)P和N得分不作為特征間距離d的一個(gè)函數(shù),隨著閾值theta增加,TP和FP都增
6、加Receiver Operating Characteristic,翻譯為"接受者操作特性曲線(xiàn)",夠拗口的。曲線(xiàn)由兩個(gè)變量1-specificity 和 Sensitivity繪制. 1-specificity=FPR,即負(fù)正類(lèi)率。Sensitivity即是真正類(lèi)率,TPR(True positive rate),反映了正類(lèi)覆蓋程度。這個(gè)組合以1-specificity對(duì)sensitivity,即是以代價(jià)(costs)對(duì)收益(benefits)。 此外,ROC曲線(xiàn)還可以用來(lái)計(jì)算“均值平均精度”(mean average
7、precision),這是當(dāng)你通過(guò)改變閾值來(lái)選擇最好的結(jié)果時(shí)所得到的平均精度(PPV).下表是一個(gè)邏輯回歸得到的結(jié)果。將得到的實(shí)數(shù)值按大到小劃分成10個(gè)個(gè)數(shù) 相同的部分。 Percentile實(shí)例數(shù)正例數(shù)1-特異度(%)敏感度(%)10618048792.7334.6420618028049.8054.55306180216518.2269.92406180150628.0180.6250618098738.9087.6260618052950.7491.3870618036562.9393.9780618029475.2696.0690618029787.5998.171006177258100.00100.00其正例數(shù)為此部分里實(shí)際的正類(lèi)數(shù)。也就是說(shuō),將邏輯回歸得到的結(jié) 果按從大到小排列,倘若以前10%的數(shù)值作為閥值,即將前10%的實(shí)例都劃歸為正類(lèi),6180個(gè)。其中,正確的個(gè)數(shù)為4879個(gè),占所有正類(lèi)的 4879
溫馨提示
- 1. 本站所有資源如無(wú)特殊說(shuō)明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請(qǐng)下載最新的WinRAR軟件解壓。
- 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請(qǐng)聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶(hù)所有。
- 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁(yè)內(nèi)容里面會(huì)有圖紙預(yù)覽,若沒(méi)有圖紙預(yù)覽就沒(méi)有圖紙。
- 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
- 5. 人人文庫(kù)網(wǎng)僅提供信息存儲(chǔ)空間,僅對(duì)用戶(hù)上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對(duì)用戶(hù)上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對(duì)任何下載內(nèi)容負(fù)責(zé)。
- 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請(qǐng)與我們聯(lián)系,我們立即糾正。
- 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時(shí)也不承擔(dān)用戶(hù)因使用這些下載資源對(duì)自己和他人造成任何形式的傷害或損失。
最新文檔
- 2025年農(nóng)村產(chǎn)業(yè)融合與農(nóng)村金融風(fēng)險(xiǎn)防控體系構(gòu)建研究
- 支氣管擴(kuò)張題目及答案
- 油站安全試題及答案
- 2025年農(nóng)產(chǎn)品質(zhì)量安全追溯體系與消費(fèi)者信任度提升策略報(bào)告
- 2025年農(nóng)產(chǎn)品質(zhì)量安全追溯體系構(gòu)建與實(shí)施策略研究報(bào)告
- 儀器安全培訓(xùn)試題及答案
- 2019陜西中考試題及答案
- 2019初級(jí)會(huì)計(jì)考試試題及答案
- 【高考物理】2026高考 導(dǎo)與練總復(fù)習(xí)物理一輪(基礎(chǔ)版)第六章 第2講 動(dòng)能和動(dòng)能定理含答案
- 鏈人計(jì)劃第一階段測(cè)試題及答案
- 中國(guó)重點(diǎn)、熱點(diǎn)區(qū)域(講練)-2025年中考地理二輪復(fù)習(xí)(全國(guó)版)
- 2025年統(tǒng)計(jì)學(xué)期末考試題庫(kù)-深度解析綜合案例分析題
- 2024北京朝陽(yáng)區(qū)五年級(jí)(下)期末數(shù)學(xué)試題及答案
- 多模態(tài)成像技術(shù)在醫(yī)學(xué)中的應(yīng)用-全面剖析
- 汽車(chē)點(diǎn)火考試題及答案
- 2024年湖南學(xué)考選擇性考試政治真題及答案
- 公司欠款清賬協(xié)議書(shū)
- 醫(yī)院培訓(xùn)課件:《十八項(xiàng)核心醫(yī)療制度解讀》
- 七年級(jí)英語(yǔ)下冊(cè) Unit 1 Can you play the guitar教學(xué)設(shè)計(jì) (新版)人教新目標(biāo)版
- 35千伏電力工程監(jiān)理實(shí)施細(xì)則
- 以DeepSeek為代表的AI在能源行業(yè)的應(yīng)用前景預(yù)測(cè)
評(píng)論
0/150
提交評(píng)論