




下載本文檔
版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請(qǐng)進(jìn)行舉報(bào)或認(rèn)領(lǐng)
文檔簡(jiǎn)介
1、、信度信度概念:信度主要是指測(cè)量結(jié)果的可靠性或一致性。信度只受隨機(jī)誤差的影響,隨機(jī)誤差越大,信度越低。因此,信度可以視為測(cè)試結(jié)果受 隨機(jī)誤差影響的程度。系統(tǒng)誤差產(chǎn)生恒定效應(yīng),不影響信度。每一個(gè)測(cè)試的實(shí)得分?jǐn)?shù)(X)總是由真實(shí)分?jǐn)?shù)和誤差(E)兩部分構(gòu)成的,用公式表示如 下:X=T+E如果我們討論一組測(cè)驗(yàn)分?jǐn)?shù)的特性時(shí),可用方差代表具體分?jǐn)?shù),得到公式:SA2 (x) =SA2(t)+SA2(e)公式中,5 (x)是實(shí)得分?jǐn)?shù)的方差,S2(t)是真分?jǐn)?shù)的方差,SW(e)是誤差的方差在測(cè)量理論中,信度被定義為:一組測(cè)量分?jǐn)?shù)的真分?jǐn)?shù)方差與中方差(實(shí)得方差)的比 率。即:r(xx)=SA2(t)/SA2 (x)
2、由于真實(shí)分?jǐn)?shù)的方差是無法統(tǒng)計(jì)的,因此轉(zhuǎn)化為:r(xx)=SA2(x)-SA2(e)/SA2(x)=1-SA2(e)/SA2(x)因此,信度也可以看做是總方差中非測(cè)量誤差的方差所占的比例信度的三種類型重測(cè)信度:比較相同受試在不同時(shí)間所得分?jǐn)?shù)(所測(cè)特質(zhì)、能力或態(tài)度上無變化時(shí))重測(cè)信度所考察的誤差來源是時(shí)間的變化所帶來的隨機(jī)影響。在評(píng)估重測(cè)信度時(shí), 必須注意重測(cè)間隔的時(shí)間。對(duì)于人格測(cè)驗(yàn),重測(cè)間隔在兩周到6個(gè)月之間比較合適。在進(jìn)行重測(cè)信度的評(píng)估時(shí),還應(yīng)注意以下兩個(gè)重要問題:重測(cè)信度一般只反映由 隨機(jī)因素導(dǎo)致的變化,而不反映被試行為的長(zhǎng)久變化。不同的行為受隨機(jī)誤差影響不 同。內(nèi)部一致性(分半信度):比較
3、受試完成實(shí)驗(yàn)的兩半的得分分半信度系數(shù)是通過將測(cè)驗(yàn)分成兩半,計(jì)算這兩半測(cè)驗(yàn)之間的相關(guān)性而獲得的信度系數(shù)。 測(cè)驗(yàn)愈長(zhǎng),信度系數(shù)愈高。同質(zhì)性信度是指測(cè)驗(yàn)內(nèi)部的各題目在多大程度上考察了同一 內(nèi)容。同質(zhì)性信度低時(shí),即使各個(gè)測(cè)試題看起來似乎是測(cè)量同一特質(zhì),但測(cè)驗(yàn)實(shí)際上是 異質(zhì)的,即測(cè)驗(yàn)測(cè)量了不止一種特質(zhì)。同質(zhì)性分析與項(xiàng)目分析中的內(nèi)部一致性分析相類 似。評(píng)卷者信度估計(jì)那些在評(píng)分中需要做主觀判斷的人的信度。+最簡(jiǎn)單的估計(jì)方法就是隨機(jī)抽取若干份答卷,由兩個(gè)獨(dú)立的評(píng)分者打分,再求每份答卷 兩個(gè)評(píng)判分?jǐn)?shù)的相關(guān)系數(shù)。這種相關(guān)系數(shù)的計(jì)算可以用積差相關(guān)方法,也可以采用斯皮 爾曼等級(jí)相關(guān)方法。影響信度的因素一、樣本特征1、
4、樣本團(tuán)體異質(zhì)性的影響2、樣本團(tuán)體的平均能力水平的影響二、測(cè)量長(zhǎng)度一般來說,在一個(gè)測(cè)試中增加同質(zhì)的題目,可以使信度提高。需注意的是,增加測(cè)驗(yàn)長(zhǎng)度的效果應(yīng)當(dāng)遵循報(bào)酬遞減原則。通過斯皮爾曼-布朗公式的 導(dǎo)出公式可以計(jì)算出最少應(yīng)增加的題目:K=r(kk)*(1-r(xx)/r(xx)*(r(kk)-1)K為改變后的長(zhǎng)度與原長(zhǎng)度之比,r(xx)為原測(cè)試的信度,r(kk)為測(cè)驗(yàn)長(zhǎng)度是原來的K倍 時(shí)的信度估計(jì)。三、測(cè)驗(yàn)難度理論上說,只有測(cè)驗(yàn)難度為50%時(shí),才能使測(cè)驗(yàn)分?jǐn)?shù)分布范圍最大,求得的信度也最高。 事實(shí)上,難度為0.50只適合于簡(jiǎn)答型題目,對(duì)于選擇題目由于猜測(cè)因素,難度值應(yīng)當(dāng)提高, 洛德提出在學(xué)習(xí)成績(jī)中
5、,為了保證其可靠性,各類選擇題的理想平均難度為:五擇一測(cè),0.70; 四擇一測(cè),0.74;三擇一測(cè),0.77;是非題。0.85在實(shí)際情況下,如果某個(gè)測(cè)驗(yàn)適用范圍廣,其難度水平通常適用于中等能力水平的被試, 而對(duì)較高水平的被試和較低水平的被試可能較易或較難,使得分?jǐn)?shù)分布范圍縮小,信度水平 降低,因此一個(gè)標(biāo)準(zhǔn)化的測(cè)驗(yàn),應(yīng)根據(jù)不同能力水平的報(bào)告測(cè)驗(yàn)的難度,以作為選擇測(cè)驗(yàn)的 參考四、重測(cè)間隔時(shí)間間隔只對(duì)重測(cè)信度和不同時(shí)測(cè)量時(shí)的復(fù)本信度有影響,對(duì)其余的信度來說,不存在 時(shí)間間隔問題。注:我們對(duì)一套問卷的信度檢驗(yàn)值(一般是指克隆巴赫阿爾法信度系數(shù))有時(shí)會(huì)出現(xiàn)過 低的情況,可能的原因有:1、試卷本身設(shè)計(jì)不合
6、理,不是圍繞一個(gè)主題或是有矛盾的題目。如果試卷中有題目讓 完全相同的人選擇不同的答案,試卷的信度會(huì)降低。2、題目區(qū)分度過低,特別指有對(duì)錯(cuò)之分的題目。如果一道題正確率或錯(cuò)誤率達(dá)到90%, 可以從新審視題目設(shè)計(jì)是否合理。區(qū)分度過低的題目中真實(shí)偏差的成分較少,隨機(jī)偏差的成 分相對(duì)較多,試卷的信度會(huì)降低。3、無關(guān)變量進(jìn)入信度檢驗(yàn)。除了重測(cè)信度,其他信度檢驗(yàn)方法都只考慮有序變量,無 序變量,如出身城市,喜好顏色等,如果我們沒有對(duì)城市或顏色排序的話,帶入信度檢驗(yàn)意 義難明,可能會(huì)導(dǎo)致試卷的信度降低。4、題目選項(xiàng)反序。對(duì)有序變量,如果變量值之間序的意義相反,會(huì)降低甚至得出負(fù)的信度。 比如檢驗(yàn)老師對(duì)學(xué)生評(píng)分的
7、信度,如果一個(gè)老師的評(píng)分以10分為最高分,1分最低,另一 個(gè)以1分最高,10分最低。如果不經(jīng)處理帶入信度計(jì)算,信度會(huì)降低。信度的指標(biāo)一、信度系數(shù)與信度指數(shù)大部分情況下,信度是以信度系數(shù)為指標(biāo),它是一種相關(guān)系數(shù)。常常是同一被試樣本所 得到的兩組資料的相關(guān),理論上說就是真分?jǐn)?shù)方差與實(shí)得分?jǐn)?shù)方差的比值,公式為:r(xx)=rA2(xt)=SA2(t)/SA2 (x)公式中M2(xt)是真分?jǐn)?shù)標(biāo)準(zhǔn)差與實(shí)得分?jǐn)?shù)標(biāo)準(zhǔn)差的比值,稱作信度系數(shù),公式為:r(xt)=S(t)/S(x)可見信度指數(shù)的平方就是信度系數(shù)。二、測(cè)量標(biāo)準(zhǔn)誤信度系數(shù)僅表示一組測(cè)量的實(shí)得分?jǐn)?shù)與真分?jǐn)?shù)的符合程度,但并沒有直接指出個(gè)人測(cè)驗(yàn) 分?jǐn)?shù)的
8、變異量。我們可以用一組被試兩次測(cè)量結(jié)果來代替對(duì)同一個(gè)人的反復(fù)施測(cè),于是有了 信度的另一個(gè)指標(biāo),公式為:SE=S(x) V 1-r(xx)公式中SE為測(cè)量的標(biāo)準(zhǔn)誤,S(x)是所得分?jǐn)?shù)的標(biāo)準(zhǔn)差,r(xx)為測(cè)驗(yàn)的信度系數(shù),從公式 我們可以看出測(cè)量的標(biāo)準(zhǔn)誤與信度之間有互為消長(zhǎng)的關(guān)系:信度越高,標(biāo)準(zhǔn)誤越小,信度越 低,標(biāo)準(zhǔn)誤越大。二、效度效度概念測(cè)驗(yàn)在多大程度上實(shí)際測(cè)量了它宣稱要測(cè)試的內(nèi)容。效度是科學(xué)的測(cè)量工具所必須具備的最重要的條件。在社會(huì)測(cè)量中,對(duì)作為測(cè)量工具的 問卷或量表的效度要求較高。鑒別效度須明確測(cè)量的目的與范圍,考慮所要測(cè)量的內(nèi)容并分 析其性質(zhì)與特征,檢查測(cè)量的內(nèi)容是否與測(cè)量的目的相符,進(jìn)
9、而判斷測(cè)量結(jié)果是否反映了 所要測(cè)量的特質(zhì)的程度。效度證據(jù)五個(gè)來源:測(cè)驗(yàn)內(nèi)容,反應(yīng)過程,內(nèi)部結(jié)構(gòu),與其他變量之間的關(guān)系,測(cè)驗(yàn)結(jié)果三傳統(tǒng)效度證據(jù):內(nèi)容效度,效標(biāo)效度,構(gòu)想效度測(cè)試效度的維度表面效度(face validity)。指測(cè)試應(yīng)達(dá)到的卷面標(biāo)準(zhǔn),即一套測(cè)試題從表面看來是否 是合適的。例如,若一次閱讀理解力的測(cè)試包括許多受試者沒有學(xué)過的方言詞匯,則可認(rèn)為 這次測(cè)試缺乏表面效度。表面效度是測(cè)試出受試者正常水平的一種保證因素。內(nèi)容效度(content validity)。指一套測(cè)試題是否測(cè)試了應(yīng)該測(cè)試的內(nèi)容或者說所測(cè) 試的內(nèi)容是否反映了測(cè)試的要求,即測(cè)試的代表性和覆蓋面的程度。例如,如果某一套發(fā)音
10、 技能測(cè)試題僅僅考查發(fā)音所必須具備的某些技能,如只考單一音素的發(fā)音,而不考查重讀、 語調(diào)或音素在詞語中的發(fā)音,那么,該測(cè)試的內(nèi)容效度就很低。編制效度(construct validity)。指一套測(cè)試題的諸項(xiàng)目對(duì)編制該測(cè)試所依據(jù)的理論的 各個(gè)基本方面的反映程度。例如,以結(jié)構(gòu)主義語言理論為基礎(chǔ),認(rèn)為系統(tǒng)的語言習(xí)慣是通過 句型而獲得的,那么,強(qiáng)調(diào)詞匯和語法環(huán)境的測(cè)試題目就失去了編制效度。經(jīng)驗(yàn)效度(empirical validity)0經(jīng)驗(yàn)效度是一種衡量測(cè)試有效性的量度,通過把一次 測(cè)試與一個(gè)或多個(gè)標(biāo)準(zhǔn)尺度相對(duì)照而得出。經(jīng)驗(yàn)效度可分為兩種:一是共時(shí)效度(concurrent validity),即
11、將一次測(cè)試的結(jié)果同另一次時(shí)間相近的有效測(cè)試的結(jié)果相比較,或同教師的鑒 定相比較而得出的系數(shù);二是預(yù)測(cè)效度(predictive validity),即將一次測(cè)試的結(jié)果同后來的 語言能力相比較,或是同教師后來對(duì)學(xué)生的鑒定相比較而得出的系數(shù)。一般來說,對(duì)某次測(cè)試的效度進(jìn)行檢驗(yàn)時(shí),除了要根據(jù)教學(xué)大綱的要求和觀念有效性的 理論對(duì)試卷的內(nèi)容進(jìn)行考查以外,還須采用計(jì)算相關(guān)系數(shù)的定量方法,即計(jì)算出本次試卷與 另一份已被確定能正確反映受試者水平的試卷之間的相關(guān)系數(shù)。系數(shù)高則有效性大。課堂測(cè) 試的效度應(yīng)在0.4-0.7之間,規(guī)模較大的測(cè)試其效度應(yīng)在0.7以上。內(nèi)容效度測(cè)驗(yàn)題目在多大程度上代表了要測(cè)量的構(gòu)想特制或
12、者屬性。憑借邏輯去判斷一項(xiàng)測(cè)量工具是否有效,憑借對(duì)概念的了解去鑒別該變量的特征是否 都被考慮到,在理論層次上概念所具有的各種特征,在經(jīng)驗(yàn)層次上的測(cè)量也應(yīng)具有,如果 二者相吻合,則表示具有內(nèi)容效度;否則,便是無內(nèi)容效度。估計(jì)內(nèi)容效度的方法編制測(cè)驗(yàn)的過程中實(shí)施一系列系統(tǒng)性的步驟來確認(rèn);測(cè)驗(yàn)編制完成后評(píng)價(jià)其內(nèi)容。內(nèi)容效度構(gòu)建步驟確定任務(wù)范疇細(xì)化工作任務(wù)的內(nèi)容確認(rèn)知識(shí)、能力和技術(shù)的內(nèi)容范疇細(xì)化所有KSA的內(nèi)容范疇A.C維度的定義A.C維度的確認(rèn)設(shè)計(jì)A.C模擬活動(dòng)確認(rèn)每一個(gè)維度的行為樣本的適用性標(biāo)準(zhǔn)化與考官培訓(xùn)效標(biāo)效度確定測(cè)驗(yàn)分?jǐn)?shù)是否系統(tǒng)性的與其他成功的指標(biāo)或者校標(biāo)相關(guān),分為預(yù)測(cè)效標(biāo)效度和同時(shí) 效標(biāo)效度
13、同一概念可能有多種測(cè)量方法,假如其中一種成為校標(biāo),另外一種就可以與之比較而 判斷其效度。當(dāng)某種測(cè)量法A具有內(nèi)容效度時(shí),另一種測(cè)量法B的校標(biāo)效度則由A決定; 如果測(cè)試某樣本,顯示B與A高度相關(guān),即謂B校標(biāo)效度高。校標(biāo)關(guān)聯(lián)效度的證據(jù)收集方法預(yù)測(cè)效標(biāo)關(guān)聯(lián)效度,測(cè)驗(yàn)分?jǐn)?shù)和后來一一通常是幾個(gè)月后一一得到的校標(biāo)分?jǐn)?shù)的相關(guān);同時(shí)效標(biāo)關(guān)聯(lián)效度,測(cè)驗(yàn)分?jǐn)?shù)和同時(shí)一一通常是一周內(nèi)的一一得到的校標(biāo)分?jǐn)?shù)的相關(guān);效度系數(shù)預(yù)測(cè)效度中的全距限制;預(yù)測(cè)消毒中,被試被測(cè)量的能力或特質(zhì)的改變;適合診斷行為、情緒或者精神障礙的臨床測(cè)驗(yàn)的效度構(gòu)想效度以數(shù)據(jù)證實(shí)測(cè)驗(yàn)分?jǐn)?shù)與可觀察行為之間的關(guān)系同測(cè)驗(yàn)中暗含的力量所預(yù)想的一樣。如果在理論層次上,概念X和概念Y是相關(guān)的,那末,在經(jīng)驗(yàn)層次上對(duì)X的測(cè)量與對(duì) Y的測(cè)量也相關(guān),假如有另一個(gè)對(duì)X的測(cè)量,則它也應(yīng)該與Y的測(cè)量相關(guān),這就稱作構(gòu)想 效度。構(gòu)想存在與設(shè)想中的潛在的態(tài)度和特質(zhì),行為是可觀察和測(cè)量的活動(dòng),是具體的構(gòu)想。構(gòu)想 可用于編訂測(cè)驗(yàn)計(jì)劃。對(duì)于同一個(gè)抽象構(gòu)想,不同人會(huì)有不同定義。構(gòu)想說明即定義一個(gè)心理學(xué)構(gòu)想的三步驟定義域構(gòu)想相
溫馨提示
- 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請(qǐng)下載最新的WinRAR軟件解壓。
- 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請(qǐng)聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
- 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會(huì)有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
- 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
- 5. 人人文庫網(wǎng)僅提供信息存儲(chǔ)空間,僅對(duì)用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對(duì)用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對(duì)任何下載內(nèi)容負(fù)責(zé)。
- 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請(qǐng)與我們聯(lián)系,我們立即糾正。
- 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時(shí)也不承擔(dān)用戶因使用這些下載資源對(duì)自己和他人造成任何形式的傷害或損失。
最新文檔
- T/CECS 10279-2023纖維增強(qiáng)聚合物基管廊
- T/CECS 10017-2019現(xiàn)制水性橡膠高分子復(fù)合防水卷材
- T/CCT 015-2024氣流床水煤漿氣化用煤
- T/CCSAS 039-2023儲(chǔ)存單元操作機(jī)械化、自動(dòng)化設(shè)計(jì)方案指南
- T/CCS 070-2023井工煤礦智能化巡檢機(jī)器人運(yùn)維管理規(guī)范
- T/CCS 036-2023煤礦帶式輸送機(jī)巡檢機(jī)器人
- T/CCMA 0172-2023移動(dòng)式升降工作平臺(tái)施工現(xiàn)場(chǎng)管理規(guī)程
- T/CCMA 0147-2023異型吊籃安裝、使用和拆卸安全技術(shù)規(guī)程
- T/CAZG 014-2022動(dòng)物園動(dòng)物疫病監(jiān)測(cè)管理規(guī)范
- T/CAS 413-2020排水管道檢測(cè)和非開挖修復(fù)工程監(jiān)理規(guī)程
- 2025屆福建省漳州市高三第三次教學(xué)質(zhì)量檢測(cè)生物試卷(解析版)
- 2025年茶葉加工工職業(yè)技能競(jìng)賽參考試題庫500題(含答案)
- 2025甘肅陜煤集團(tuán)韓城煤礦招聘250人筆試參考題庫附帶答案詳解
- 2025年社區(qū)工作的理論與實(shí)務(wù)考試題及答案
- 《設(shè)計(jì)課件:構(gòu)建高效數(shù)據(jù)集教程》
- 2025江蘇中考:歷史高頻考點(diǎn)
- SL631水利水電工程單元工程施工質(zhì)量驗(yàn)收標(biāo)準(zhǔn)第1部分:土石方工程
- 廣東省2024年中考數(shù)學(xué)試卷【附真題答案】
- 監(jiān)控立桿基礎(chǔ)國(guó)家標(biāo)準(zhǔn)
- 那洛巴尊者傳
- 包材產(chǎn)品HACCP計(jì)劃
評(píng)論
0/150
提交評(píng)論