




版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請進(jìn)行舉報(bào)或認(rèn)領(lǐng)
文檔簡介
第十一章測量的種類及其質(zhì)量分析第十一章測量的種類及其質(zhì)量分析第一節(jié)教育測量的種類根據(jù)測量的目標(biāo)分類:智力測量、成績測量、品德狀況測量、人格特征測量、能力傾向測量。根據(jù)測量的方式分類:個(gè)別測量、團(tuán)體測量根據(jù)測量的材料分:文字測量和非文字測量根據(jù)測量的來源分:標(biāo)準(zhǔn)化測量、教師自編測量根據(jù)參照標(biāo)準(zhǔn)分:常模參照測量、標(biāo)準(zhǔn)參照測量第一節(jié)教育測量的種類根據(jù)測量的目標(biāo)分類:智力測量、成績第二節(jié)測量的信度一、信度的概念信度是指測驗(yàn)結(jié)果的一直性或可靠性的程度信度可以理解為:(一)實(shí)測值和真值相差的程度
X=T+E(二)兩次重復(fù)測量或等值測量之間的關(guān)聯(lián)程度第二節(jié)測量的信度一、信度的概念二、信度的估計(jì)方法(一)穩(wěn)定性系數(shù)(重測信度)指用同一試卷對相同被試者在不同時(shí)間測驗(yàn)兩次的實(shí)得分?jǐn)?shù)的相關(guān)系數(shù)例:用某量表測驗(yàn)10個(gè)學(xué)生,得分記為X。為了考察測量結(jié)果的可靠性,于15天后用原量表對這10個(gè)學(xué)生重測一次,得分記為Y。問測驗(yàn)結(jié)果是否可靠?二、信度的估計(jì)方法教育測量的種類與質(zhì)量分析課件(二)等值性系數(shù)(復(fù)本信度)等值性系數(shù)是估計(jì)測驗(yàn)間跨形式的一致性指標(biāo),是以兩個(gè)等值(題型、題數(shù)、難度、區(qū)分度相同)但具體內(nèi)容不同的量表,在最短時(shí)間內(nèi),對相同應(yīng)試者先后施測兩次測驗(yàn)所獲得的兩組對應(yīng)分?jǐn)?shù)的相關(guān)系數(shù)。(二)等值性系數(shù)(復(fù)本信度)(三)內(nèi)部一致性系數(shù)(同質(zhì)性信度)是估計(jì)測驗(yàn)內(nèi)部跨測題的一致性指標(biāo),是同一測驗(yàn)試卷的兩個(gè)部分得分的相關(guān)系數(shù)計(jì)算方法有兩種:1.分半信度是把一次測驗(yàn)按題目番號分為兩半,一半是奇數(shù)題,一半是偶數(shù)題,計(jì)算兩部分的相關(guān)系數(shù),最后用斯皮爾曼-布朗公式校正(三)內(nèi)部一致性系數(shù)(同質(zhì)性信度)教育測量的種類與質(zhì)量分析課件教育測量的種類與質(zhì)量分析課件2.庫德爾-理查森公式法(1)rKR20的用法:這個(gè)公式以每題能正確回答的人數(shù)占總?cè)藬?shù)的百分?jǐn)?shù)為基礎(chǔ)計(jì)算rKR20為整個(gè)測驗(yàn)結(jié)果的信度系數(shù),K為測驗(yàn)題目數(shù),P為各題正確反應(yīng)人數(shù)占總?cè)藬?shù)的百分?jǐn)?shù);Q為個(gè)題錯(cuò)誤反應(yīng)人數(shù)占占總?cè)藬?shù)的百分?jǐn)?shù),S2為應(yīng)試者總分的方差例:有一種包含6個(gè)問題的測驗(yàn),10個(gè)應(yīng)試者得分如下,試估計(jì)應(yīng)試者反應(yīng)的一致性程度2.庫德爾-理查森公式法rKR20為整個(gè)測驗(yàn)結(jié)果的信度系數(shù),教育測量的種類與質(zhì)量分析課件教育測量的種類與質(zhì)量分析課件計(jì)算內(nèi)部一致性系數(shù)要注意的問題:(1)若用分半法時(shí),以按奇數(shù)題和偶數(shù)題分為兩半為宜。(2)若速率是測驗(yàn)的重要因素,則不宜用分半法。(3)若答案多種,得分多樣,不宜用上邊的公式計(jì)算。計(jì)算內(nèi)部一致性系數(shù)要注意的問題:3、論文式測驗(yàn)的信度系數(shù)3、論文式測驗(yàn)的信度系數(shù)教育測量的種類與質(zhì)量分析課件4、評分者信度計(jì)算方法肯德爾和諧系數(shù)公式為:4、評分者信度計(jì)算方法肯德爾和諧系數(shù)公式為:三、影響信度的因素(一)測驗(yàn)的長度
一般來說,測驗(yàn)越長,信度值越高。這是因?yàn)椋孩贉y驗(yàn)加長,可能改進(jìn)項(xiàng)目取樣的代表性,從而能更好地反映受測者的真實(shí)水平;②測驗(yàn)的項(xiàng)目越多,在每個(gè)項(xiàng)目上的隨機(jī)誤差就可以互相抵消。(三)測驗(yàn)的難度
測驗(yàn)的難度與信度沒有直接對應(yīng)關(guān)系,但是當(dāng)測驗(yàn)太難或太易時(shí),則分?jǐn)?shù)的范圍就會縮小,從而降低信度。三、影響信度的因素(一)測驗(yàn)的長度(三)測驗(yàn)內(nèi)容的同質(zhì)性(四)被試者差異(五)評分的客觀性(三)測驗(yàn)內(nèi)容的同質(zhì)性四、提高測驗(yàn)信度的方法1.適當(dāng)增加測驗(yàn)題目的數(shù)量2.測驗(yàn)的難度要適中3.測驗(yàn)的內(nèi)容要盡量同質(zhì)4.測驗(yàn)的程序應(yīng)統(tǒng)一5.測驗(yàn)的時(shí)間要充分6.評分要客觀四、提高測驗(yàn)信度的方法第三節(jié)效度一、效度的概念效度是量表能實(shí)際測量出其所要測量的特性或功能的程度。效度可從以下幾方面理解:第一,測量的效度始終是對一定的測量目的而言的。第二,測量的效度是對測量結(jié)果而言的第三,測量的效度只是高低問題第四,在教育測量中,測量效度顯得更為重要第三節(jié)效度一、效度的概念信度和效度的關(guān)系:信度是效度的必要非充分條件一個(gè)測驗(yàn)的效度不會超過它的信度的平方根信度和效度的關(guān)系:信度是效度的必要非充分條件二、效度的類別和估計(jì)方法效度的種類內(nèi)容效度結(jié)構(gòu)效度效標(biāo)關(guān)聯(lián)效度測驗(yàn)題目樣本對于應(yīng)測內(nèi)容與行為領(lǐng)域的代表性程度側(cè)重于測驗(yàn)題目取樣的代表性,考查這些題目對所欲測量的內(nèi)容和行為反應(yīng)測量的有效程度結(jié)構(gòu):心理學(xué)或社會學(xué)上的一種理論構(gòu)想或特質(zhì)側(cè)重于一個(gè)測驗(yàn)?zāi)軌驕y量到心理學(xué)和教學(xué)理論上的抽象概念或特質(zhì)的程度效標(biāo):檢驗(yàn)測驗(yàn)效度的參照標(biāo)準(zhǔn),實(shí)際上是本測驗(yàn)所想測量或要預(yù)測的特性或功能測驗(yàn)分?jǐn)?shù)與作為效標(biāo)的另一獨(dú)立測驗(yàn)結(jié)果之間的一致性程度二、效度的類別和估計(jì)方法效度的種類內(nèi)容效度結(jié)構(gòu)效度效標(biāo)關(guān)聯(lián)效(一)內(nèi)容效度的概念和估計(jì)方法1.內(nèi)容效度的概念測驗(yàn)試題對欲測驗(yàn)內(nèi)容或行為目標(biāo)的代表性程度2.內(nèi)容效度的驗(yàn)證方法邏輯分析法統(tǒng)計(jì)分析法(定量的方法)(一)內(nèi)容效度的概念和估計(jì)方法1.內(nèi)容效度的概念邏輯分析法(定性的方法)依靠有關(guān)專家對測驗(yàn)題目與應(yīng)測內(nèi)容范圍的吻合程度作出判斷對每一道題目逐一進(jìn)行審查,以此形成“題目雙向細(xì)目表”與“命題雙向細(xì)目表”加以對照,以確定試卷的效度邏輯分析法(定性的方法)統(tǒng)計(jì)分析法(定量的方法)克龍巴赫法(兩套測驗(yàn)試題,對相同被試實(shí)施測試后,計(jì)算得分的相關(guān)系數(shù))評分一致性考查法(不同評分者之間評分的一致性程度,即考查評分者信度)前后測對比法(根據(jù)前后兩次測驗(yàn)的差異顯著性,確定測驗(yàn)的內(nèi)容效度)統(tǒng)計(jì)分析法(定量的方法)(二)、構(gòu)想效度及其驗(yàn)證方法1.結(jié)構(gòu)效度的概念測驗(yàn)對于人的假設(shè)屬性或理論概念測量到的程度這些假設(shè)屬性或理論概念是決定人們外部行為的內(nèi)隱或潛在的特性(二)、構(gòu)想效度及其驗(yàn)證方法1.結(jié)構(gòu)效度的概念2.結(jié)構(gòu)效度的建立過程①對所欲測量的屬性根據(jù)某種理論提出假定的結(jié)構(gòu)②根據(jù)假定的結(jié)構(gòu)擬定測試題,編制測驗(yàn)③尋求測驗(yàn)分?jǐn)?shù)與其它評定之間的關(guān)系④以測驗(yàn)結(jié)果為根據(jù)來驗(yàn)證假設(shè)結(jié)構(gòu)中的各種因素是否成立,驗(yàn)證的方法可以從差異性上尋求證據(jù)⑤將與假設(shè)結(jié)構(gòu)相違背的測試題刪去,對測驗(yàn)進(jìn)行修改之后,再重新實(shí)施第③和第④個(gè)步驟2.結(jié)構(gòu)效度的建立過程結(jié)構(gòu)效度建立的示例建立理論框架從理論框架出發(fā),提出各種假設(shè)根據(jù)假設(shè)編制測驗(yàn)以邏輯及實(shí)證的方法,檢驗(yàn)結(jié)果是否符合心理學(xué)的理論框架及其假設(shè)比如:中學(xué)生數(shù)學(xué)能力的研究數(shù)學(xué)能力由分析能力、綜合能力、歸納和演繹能力、運(yùn)算能力、空間想象能力構(gòu)成;數(shù)學(xué)能力與早期教育有關(guān);數(shù)學(xué)能力與智力正相關(guān)。編制測驗(yàn),施測并收集測驗(yàn)結(jié)果分析測驗(yàn)結(jié)果,考查測試的結(jié)構(gòu)效度,考查測驗(yàn)結(jié)果是否支持理論構(gòu)想結(jié)構(gòu)效度建立的示例(三)、效標(biāo)關(guān)聯(lián)效度及其驗(yàn)證方法1.效標(biāo)關(guān)聯(lián)效度的驗(yàn)證方法效標(biāo)關(guān)聯(lián)效度是指測驗(yàn)分?jǐn)?shù)與作為效標(biāo)的另一獨(dú)立測驗(yàn)結(jié)果之間的一致性程度,即推斷某測驗(yàn)所得分?jǐn)?shù)與同類標(biāo)準(zhǔn)測驗(yàn)所得分?jǐn)?shù)的相關(guān)程度。效標(biāo)關(guān)聯(lián)效度(criterion-relatedvalidity)的驗(yàn)證方法是指一個(gè)測驗(yàn)對于處于特定情境中的個(gè)體行為進(jìn)行預(yù)測時(shí)的有效性。(三)、效標(biāo)關(guān)聯(lián)效度及其驗(yàn)證方法1.效標(biāo)關(guān)聯(lián)效度的驗(yàn)證方法效標(biāo):檢驗(yàn)測驗(yàn)效度的外在的、客觀的標(biāo)準(zhǔn),即效度的標(biāo)準(zhǔn).效標(biāo)是足以顯示測驗(yàn)所欲測量的或要測量的特性的變量。效標(biāo):檢驗(yàn)測驗(yàn)效度的外在的、客觀的標(biāo)準(zhǔn),即效度的標(biāo)準(zhǔn).效標(biāo)是分類:同時(shí)效度:測驗(yàn)分?jǐn)?shù)與效標(biāo)資料的取得約在同一時(shí)間內(nèi)連續(xù)完成,這兩種資料的相關(guān)系數(shù)即為同時(shí)效度預(yù)測效度:在測驗(yàn)分?jǐn)?shù)取得一段時(shí)間后,才獲得效標(biāo)資料,計(jì)算這兩種資料間的相關(guān)系數(shù)即代表測驗(yàn)的預(yù)測效度。分類:效標(biāo)關(guān)聯(lián)效度的估計(jì)方法相關(guān)法直接計(jì)算測驗(yàn)分?jǐn)?shù)與效標(biāo)分?jǐn)?shù)的相關(guān)系數(shù)積差相關(guān)、等級相關(guān)、二列相關(guān)等顯著差異法根據(jù)效標(biāo)測量將被試分為兩個(gè)極端組,檢驗(yàn)這兩個(gè)組測驗(yàn)分?jǐn)?shù)是否具有統(tǒng)計(jì)學(xué)上的差異顯著性命中率當(dāng)測驗(yàn)用作取舍決策時(shí),常使用命中率相關(guān)概念:總命中率、正命中率、負(fù)命中率總命中率高,則測試的效度高例:70人參加的考試,通過測驗(yàn)選取了50人,淘汰了20人;選出的人中有40人合格,淘汰的人中有8人不合格。該測驗(yàn)的總命中率、正命中率和負(fù)命中率分別是多少?效標(biāo)關(guān)聯(lián)效度的估計(jì)方法相關(guān)法第四節(jié)項(xiàng)目的難度一、難度的含義難度是指測驗(yàn)項(xiàng)目的難易程度刻畫被試作答一個(gè)題目所遇到的困難程度的量數(shù),叫做題目的難度系數(shù),用符號P表示在教育測量中,P=正確回答試題的人數(shù)R/參加測驗(yàn)的總?cè)藬?shù)N二、難度的計(jì)算客觀試題(二分法記分):P=R/NR:答對該題的人數(shù);N:參加測驗(yàn)的總?cè)藬?shù)主觀題難度計(jì)算P=XK第四節(jié)項(xiàng)目的難度一、難度的含義P=XK教育測量與評價(jià)中題目(項(xiàng)目)的難度二、難度的計(jì)算客觀題的極端分組法根據(jù)測驗(yàn)分?jǐn)?shù)按高低排序,用兩個(gè)極端組(高分、低分)在某項(xiàng)目上的平均通過率表示項(xiàng)目的難度步驟:按測驗(yàn)總分由高到低排序從高分段向下選出全部試卷的27%作為高分組從低分段向上選出全部試卷的27%作為低分組按照上述公式計(jì)算項(xiàng)目難度值例:100人參加某測驗(yàn),高分組與低分組各取27人,其中第一題高分組20人答對,低分組10人答對。這道題的難度系數(shù)是多少?教育測量與評價(jià)中題目(項(xiàng)目)的難度二、難度的計(jì)算教育測量與評價(jià)中題目(項(xiàng)目)的難度二、難度的計(jì)算主觀題的極端分組法公式:步驟按測驗(yàn)總分依次排序,確定比例各為25%的高分組和低分組為高分組、低分組分別編制每題得分的分析表(試題分析表)用上述難度公式計(jì)算難度值教育測量與評價(jià)中題目(項(xiàng)目)的難度二、難度的計(jì)算教育測量與評價(jià)中題目(項(xiàng)目)的難度公式的含義:XH:高分組所得總分;XL:低分組所得總分;H:該題最高分;L:該題最低分;N:考生總?cè)藬?shù)的25%41040400521051578567642854088641000低分組1010100高分組XffxXffx試題分析表例:100名學(xué)生參加論文式測驗(yàn),按高、低分各占總?cè)藬?shù)的25%分組,其中第6題的得分統(tǒng)計(jì)表如下所示。求該題目的難度。教育測量與評價(jià)中題目(項(xiàng)目)的難度公式的含義:4教育測量與評價(jià)中題目(項(xiàng)目)的難度難度指出的僅僅是題目的相對難度,不能客觀地指出題目難度之間差異大小一般情況下,測驗(yàn)分?jǐn)?shù)呈正態(tài)分布教育測量與評價(jià)中題目(項(xiàng)目)的難度難度指出的僅僅是題目的相對教育測量與評價(jià)中題目(項(xiàng)目)的難度三、難度對測驗(yàn)的影響難度對測驗(yàn)分?jǐn)?shù)分布的影響過易、過難會造成測驗(yàn)分?jǐn)?shù)偏離正態(tài)分布,使測驗(yàn)分?jǐn)?shù)離散程度變小難度對測驗(yàn)鑒別力的影響測驗(yàn)的主要功效是鑒別考生實(shí)際水平的高低適宜難度可以加大考生得分的差異,從而提高測驗(yàn)的鑒別力項(xiàng)目難度的適宜值為0.5左右時(shí),測驗(yàn)得分的方差才可達(dá)最大值難度與測驗(yàn)?zāi)康牡年P(guān)系項(xiàng)目難度應(yīng)根據(jù)測驗(yàn)?zāi)康膩泶_定常模參照評價(jià):區(qū)分學(xué)生能力或成就的高低標(biāo)準(zhǔn)參照評價(jià):了解學(xué)生達(dá)到教學(xué)目標(biāo)規(guī)定的掌握程度教育測量與評價(jià)中題目(項(xiàng)目)的難度三、難度對測驗(yàn)的影響教育測量與評價(jià)中題目(項(xiàng)目)的區(qū)分度一、區(qū)分度的概念區(qū)分度是測驗(yàn)對被試實(shí)際水平的區(qū)分程度通常用D表示,取值范圍為+1.00至-1.00D越高時(shí),試題的質(zhì)量越好D為正時(shí),試題積極區(qū)分D為負(fù)時(shí),試題消極區(qū)分教育測量與評價(jià)中題目(項(xiàng)目)的區(qū)分度一、區(qū)分度的概念教育測量與評價(jià)中題目(項(xiàng)目)的區(qū)分度二、區(qū)分度計(jì)算方法極端分組法客觀性試題區(qū)分度的計(jì)算公式:D=PH-PL按測驗(yàn)總分從高到低排序確定測驗(yàn)總分最高的27%的被試作為高分組,最低的27%的被試為低分組分別求出這兩組被試通過試題的百分比將算得的有關(guān)數(shù)據(jù)帶入上公式教育測量與評價(jià)中題目(項(xiàng)目)的區(qū)分度二、區(qū)分度計(jì)算方法主觀性試題區(qū)分度的計(jì)算公式:說明:XH:高分組所得總分;XL:低分組所得總分;H:該題最高分;L:該題最低分;N:考生人數(shù)(總?cè)藬?shù)的25%)步驟:按測驗(yàn)總分由高到低排序;分別確定測驗(yàn)總分的25%、25%作為高低分組;列出試題分析表;將數(shù)據(jù)帶入以上公式加以計(jì)算主觀性試題區(qū)分度的計(jì)算公式:教育測量與評價(jià)中題目(項(xiàng)目)的區(qū)分度例:100名考生參加主觀性試題測驗(yàn),按高、低分各占人數(shù)的25%分組,其中第四題試題分析表如下所示,求該題目的區(qū)分度。41040428653063188648843210440106601200低分組1210120高分組XffxXffx試題分析表教育測量與評價(jià)中題目(項(xiàng)目)的區(qū)分度4教育測量與評價(jià)中題目(項(xiàng)目)的區(qū)分度三、區(qū)分度計(jì)算方法相關(guān)法考慮中間數(shù)據(jù)以項(xiàng)目分?jǐn)?shù)與效標(biāo)分?jǐn)?shù)的相關(guān)作為項(xiàng)目區(qū)分度的指標(biāo)(效標(biāo)分?jǐn)?shù)不易得到時(shí),以測驗(yàn)總分代替)相關(guān)越高,區(qū)分能力越好具體方法:積差相關(guān)法點(diǎn)二列相關(guān)二列相關(guān)Φ相關(guān)教育測量與評價(jià)中題目(項(xiàng)目)的區(qū)分度三、區(qū)分度計(jì)算方法積差相關(guān)法計(jì)算區(qū)分度非二分法記分的項(xiàng)目,可將題目得分與測驗(yàn)總分求積差相關(guān)系數(shù)以得到題目的區(qū)分度積差相關(guān)的另一計(jì)算公式:Sx為全體被試在某道題目上得分的標(biāo)準(zhǔn)差;Sy為全體被試總分的標(biāo)準(zhǔn)差;SD是由被試總分減去某題目得分而得到的新變量的方差積差相關(guān)法計(jì)算區(qū)分度非二分法記分的項(xiàng)目,可將題目得分與測驗(yàn)總點(diǎn)二列相關(guān)計(jì)算區(qū)分度測驗(yàn)的一個(gè)變量是連續(xù)變量,另一個(gè)變量是二分變量時(shí),要用點(diǎn)二列相關(guān)系數(shù)表示某項(xiàng)目的區(qū)分度公式的說明:p為答對某題人數(shù)占全體人數(shù)的比例q為答錯(cuò)此題人數(shù)所占全體人數(shù)的比例(q=1-p)St為全體考生的標(biāo)準(zhǔn)差生1234567891011121314151617181920總8652947265227683807576736291477481886258題1001100111101101100020個(gè)學(xué)生參加語文測驗(yàn),總分與某一個(gè)選擇題的得分情況如下表。計(jì)算該選擇題的區(qū)分度。點(diǎn)二列相關(guān)計(jì)算區(qū)分度測驗(yàn)的一個(gè)變量是連續(xù)變量,另一個(gè)變量是二二列相關(guān)計(jì)算區(qū)分度測驗(yàn)總分與項(xiàng)目分?jǐn)?shù)均為連續(xù)變量,其中一個(gè)被人為地分成兩個(gè)類別,公式的說明:p為二分變量中某一類別在全部變量中所占的比例,q為另一類別所占的比例(q=1-p)St為全部連續(xù)變量的標(biāo)準(zhǔn)差Y表示正態(tài)曲線下與P相對應(yīng)的縱線高度。生1234567891011121314151617181920總8652947265227683807576736291477481886258作4737552722103542463940413852213942482927類合合合不不不不合合合合合合合不不合合不不二列相關(guān)計(jì)算區(qū)分度測驗(yàn)總分與項(xiàng)目分?jǐn)?shù)均為連續(xù)變量,其中一個(gè)被Ф相關(guān)法計(jì)算區(qū)分度測驗(yàn)的兩個(gè)變量都是二分變量,可用計(jì)算Φ相關(guān)系數(shù)來表示某項(xiàng)目的區(qū)分度以測驗(yàn)總分劃分為合格、不合格兩類的被試在某一題目上通過、未通過的人數(shù)列成四格表來計(jì)算另一類數(shù)據(jù)合計(jì)ⅠⅡ一類數(shù)據(jù)ⅠABA+BⅡCDC+D合計(jì)A+CB+DNФ相關(guān)法計(jì)算區(qū)分度測驗(yàn)的兩個(gè)變量都是二分變量,可用計(jì)算Φ相關(guān)Ф相關(guān)法計(jì)算區(qū)分度例:45名學(xué)生考取大學(xué)的人數(shù)和在某題上通過的人數(shù)由下表所示。若以升學(xué)為效標(biāo),此題對學(xué)生是否有區(qū)分能力?205713通過考取未考取未通過檢驗(yàn)計(jì)算出的rФ值是否達(dá)到顯著性水平,還需將rФ值轉(zhuǎn)換成χ2值,再進(jìn)行χ2檢驗(yàn)。Ф相關(guān)法計(jì)算區(qū)分度例:45名學(xué)生考取大學(xué)的人數(shù)和在某題上通過練習(xí):生1234567891011121314151617181920總8690548950444328758260707581708076777950一1101000011011101111020名學(xué)生的期末成績?nèi)缦卤?,為考查第一題是否有區(qū)分能力,將該題用二分法記分,答對記1分,答錯(cuò)記0分。試計(jì)算該題的區(qū)分度。若60分以上(含60分)為升級,60分以下為留級。試用Φ相關(guān)法分析該題的區(qū)分度。練習(xí):生12345678910111213141516171教育測量與評價(jià)中題目(項(xiàng)目)的區(qū)分度三、區(qū)分度對測驗(yàn)的影響1.區(qū)分度與難度的關(guān)系難度(P)區(qū)分度(D的最大值)1.000.000.900.200.700.600.501.000.300.600.100.200.000.00教育測量與評價(jià)中題目(項(xiàng)目)的區(qū)分度三、區(qū)分度對測驗(yàn)的影響難第十一章測量的種類及其質(zhì)量分析第十一章測量的種類及其質(zhì)量分析第一節(jié)教育測量的種類根據(jù)測量的目標(biāo)分類:智力測量、成績測量、品德狀況測量、人格特征測量、能力傾向測量。根據(jù)測量的方式分類:個(gè)別測量、團(tuán)體測量根據(jù)測量的材料分:文字測量和非文字測量根據(jù)測量的來源分:標(biāo)準(zhǔn)化測量、教師自編測量根據(jù)參照標(biāo)準(zhǔn)分:常模參照測量、標(biāo)準(zhǔn)參照測量第一節(jié)教育測量的種類根據(jù)測量的目標(biāo)分類:智力測量、成績第二節(jié)測量的信度一、信度的概念信度是指測驗(yàn)結(jié)果的一直性或可靠性的程度信度可以理解為:(一)實(shí)測值和真值相差的程度
X=T+E(二)兩次重復(fù)測量或等值測量之間的關(guān)聯(lián)程度第二節(jié)測量的信度一、信度的概念二、信度的估計(jì)方法(一)穩(wěn)定性系數(shù)(重測信度)指用同一試卷對相同被試者在不同時(shí)間測驗(yàn)兩次的實(shí)得分?jǐn)?shù)的相關(guān)系數(shù)例:用某量表測驗(yàn)10個(gè)學(xué)生,得分記為X。為了考察測量結(jié)果的可靠性,于15天后用原量表對這10個(gè)學(xué)生重測一次,得分記為Y。問測驗(yàn)結(jié)果是否可靠?二、信度的估計(jì)方法教育測量的種類與質(zhì)量分析課件(二)等值性系數(shù)(復(fù)本信度)等值性系數(shù)是估計(jì)測驗(yàn)間跨形式的一致性指標(biāo),是以兩個(gè)等值(題型、題數(shù)、難度、區(qū)分度相同)但具體內(nèi)容不同的量表,在最短時(shí)間內(nèi),對相同應(yīng)試者先后施測兩次測驗(yàn)所獲得的兩組對應(yīng)分?jǐn)?shù)的相關(guān)系數(shù)。(二)等值性系數(shù)(復(fù)本信度)(三)內(nèi)部一致性系數(shù)(同質(zhì)性信度)是估計(jì)測驗(yàn)內(nèi)部跨測題的一致性指標(biāo),是同一測驗(yàn)試卷的兩個(gè)部分得分的相關(guān)系數(shù)計(jì)算方法有兩種:1.分半信度是把一次測驗(yàn)按題目番號分為兩半,一半是奇數(shù)題,一半是偶數(shù)題,計(jì)算兩部分的相關(guān)系數(shù),最后用斯皮爾曼-布朗公式校正(三)內(nèi)部一致性系數(shù)(同質(zhì)性信度)教育測量的種類與質(zhì)量分析課件教育測量的種類與質(zhì)量分析課件2.庫德爾-理查森公式法(1)rKR20的用法:這個(gè)公式以每題能正確回答的人數(shù)占總?cè)藬?shù)的百分?jǐn)?shù)為基礎(chǔ)計(jì)算rKR20為整個(gè)測驗(yàn)結(jié)果的信度系數(shù),K為測驗(yàn)題目數(shù),P為各題正確反應(yīng)人數(shù)占總?cè)藬?shù)的百分?jǐn)?shù);Q為個(gè)題錯(cuò)誤反應(yīng)人數(shù)占占總?cè)藬?shù)的百分?jǐn)?shù),S2為應(yīng)試者總分的方差例:有一種包含6個(gè)問題的測驗(yàn),10個(gè)應(yīng)試者得分如下,試估計(jì)應(yīng)試者反應(yīng)的一致性程度2.庫德爾-理查森公式法rKR20為整個(gè)測驗(yàn)結(jié)果的信度系數(shù),教育測量的種類與質(zhì)量分析課件教育測量的種類與質(zhì)量分析課件計(jì)算內(nèi)部一致性系數(shù)要注意的問題:(1)若用分半法時(shí),以按奇數(shù)題和偶數(shù)題分為兩半為宜。(2)若速率是測驗(yàn)的重要因素,則不宜用分半法。(3)若答案多種,得分多樣,不宜用上邊的公式計(jì)算。計(jì)算內(nèi)部一致性系數(shù)要注意的問題:3、論文式測驗(yàn)的信度系數(shù)3、論文式測驗(yàn)的信度系數(shù)教育測量的種類與質(zhì)量分析課件4、評分者信度計(jì)算方法肯德爾和諧系數(shù)公式為:4、評分者信度計(jì)算方法肯德爾和諧系數(shù)公式為:三、影響信度的因素(一)測驗(yàn)的長度
一般來說,測驗(yàn)越長,信度值越高。這是因?yàn)椋孩贉y驗(yàn)加長,可能改進(jìn)項(xiàng)目取樣的代表性,從而能更好地反映受測者的真實(shí)水平;②測驗(yàn)的項(xiàng)目越多,在每個(gè)項(xiàng)目上的隨機(jī)誤差就可以互相抵消。(三)測驗(yàn)的難度
測驗(yàn)的難度與信度沒有直接對應(yīng)關(guān)系,但是當(dāng)測驗(yàn)太難或太易時(shí),則分?jǐn)?shù)的范圍就會縮小,從而降低信度。三、影響信度的因素(一)測驗(yàn)的長度(三)測驗(yàn)內(nèi)容的同質(zhì)性(四)被試者差異(五)評分的客觀性(三)測驗(yàn)內(nèi)容的同質(zhì)性四、提高測驗(yàn)信度的方法1.適當(dāng)增加測驗(yàn)題目的數(shù)量2.測驗(yàn)的難度要適中3.測驗(yàn)的內(nèi)容要盡量同質(zhì)4.測驗(yàn)的程序應(yīng)統(tǒng)一5.測驗(yàn)的時(shí)間要充分6.評分要客觀四、提高測驗(yàn)信度的方法第三節(jié)效度一、效度的概念效度是量表能實(shí)際測量出其所要測量的特性或功能的程度。效度可從以下幾方面理解:第一,測量的效度始終是對一定的測量目的而言的。第二,測量的效度是對測量結(jié)果而言的第三,測量的效度只是高低問題第四,在教育測量中,測量效度顯得更為重要第三節(jié)效度一、效度的概念信度和效度的關(guān)系:信度是效度的必要非充分條件一個(gè)測驗(yàn)的效度不會超過它的信度的平方根信度和效度的關(guān)系:信度是效度的必要非充分條件二、效度的類別和估計(jì)方法效度的種類內(nèi)容效度結(jié)構(gòu)效度效標(biāo)關(guān)聯(lián)效度測驗(yàn)題目樣本對于應(yīng)測內(nèi)容與行為領(lǐng)域的代表性程度側(cè)重于測驗(yàn)題目取樣的代表性,考查這些題目對所欲測量的內(nèi)容和行為反應(yīng)測量的有效程度結(jié)構(gòu):心理學(xué)或社會學(xué)上的一種理論構(gòu)想或特質(zhì)側(cè)重于一個(gè)測驗(yàn)?zāi)軌驕y量到心理學(xué)和教學(xué)理論上的抽象概念或特質(zhì)的程度效標(biāo):檢驗(yàn)測驗(yàn)效度的參照標(biāo)準(zhǔn),實(shí)際上是本測驗(yàn)所想測量或要預(yù)測的特性或功能測驗(yàn)分?jǐn)?shù)與作為效標(biāo)的另一獨(dú)立測驗(yàn)結(jié)果之間的一致性程度二、效度的類別和估計(jì)方法效度的種類內(nèi)容效度結(jié)構(gòu)效度效標(biāo)關(guān)聯(lián)效(一)內(nèi)容效度的概念和估計(jì)方法1.內(nèi)容效度的概念測驗(yàn)試題對欲測驗(yàn)內(nèi)容或行為目標(biāo)的代表性程度2.內(nèi)容效度的驗(yàn)證方法邏輯分析法統(tǒng)計(jì)分析法(定量的方法)(一)內(nèi)容效度的概念和估計(jì)方法1.內(nèi)容效度的概念邏輯分析法(定性的方法)依靠有關(guān)專家對測驗(yàn)題目與應(yīng)測內(nèi)容范圍的吻合程度作出判斷對每一道題目逐一進(jìn)行審查,以此形成“題目雙向細(xì)目表”與“命題雙向細(xì)目表”加以對照,以確定試卷的效度邏輯分析法(定性的方法)統(tǒng)計(jì)分析法(定量的方法)克龍巴赫法(兩套測驗(yàn)試題,對相同被試實(shí)施測試后,計(jì)算得分的相關(guān)系數(shù))評分一致性考查法(不同評分者之間評分的一致性程度,即考查評分者信度)前后測對比法(根據(jù)前后兩次測驗(yàn)的差異顯著性,確定測驗(yàn)的內(nèi)容效度)統(tǒng)計(jì)分析法(定量的方法)(二)、構(gòu)想效度及其驗(yàn)證方法1.結(jié)構(gòu)效度的概念測驗(yàn)對于人的假設(shè)屬性或理論概念測量到的程度這些假設(shè)屬性或理論概念是決定人們外部行為的內(nèi)隱或潛在的特性(二)、構(gòu)想效度及其驗(yàn)證方法1.結(jié)構(gòu)效度的概念2.結(jié)構(gòu)效度的建立過程①對所欲測量的屬性根據(jù)某種理論提出假定的結(jié)構(gòu)②根據(jù)假定的結(jié)構(gòu)擬定測試題,編制測驗(yàn)③尋求測驗(yàn)分?jǐn)?shù)與其它評定之間的關(guān)系④以測驗(yàn)結(jié)果為根據(jù)來驗(yàn)證假設(shè)結(jié)構(gòu)中的各種因素是否成立,驗(yàn)證的方法可以從差異性上尋求證據(jù)⑤將與假設(shè)結(jié)構(gòu)相違背的測試題刪去,對測驗(yàn)進(jìn)行修改之后,再重新實(shí)施第③和第④個(gè)步驟2.結(jié)構(gòu)效度的建立過程結(jié)構(gòu)效度建立的示例建立理論框架從理論框架出發(fā),提出各種假設(shè)根據(jù)假設(shè)編制測驗(yàn)以邏輯及實(shí)證的方法,檢驗(yàn)結(jié)果是否符合心理學(xué)的理論框架及其假設(shè)比如:中學(xué)生數(shù)學(xué)能力的研究數(shù)學(xué)能力由分析能力、綜合能力、歸納和演繹能力、運(yùn)算能力、空間想象能力構(gòu)成;數(shù)學(xué)能力與早期教育有關(guān);數(shù)學(xué)能力與智力正相關(guān)。編制測驗(yàn),施測并收集測驗(yàn)結(jié)果分析測驗(yàn)結(jié)果,考查測試的結(jié)構(gòu)效度,考查測驗(yàn)結(jié)果是否支持理論構(gòu)想結(jié)構(gòu)效度建立的示例(三)、效標(biāo)關(guān)聯(lián)效度及其驗(yàn)證方法1.效標(biāo)關(guān)聯(lián)效度的驗(yàn)證方法效標(biāo)關(guān)聯(lián)效度是指測驗(yàn)分?jǐn)?shù)與作為效標(biāo)的另一獨(dú)立測驗(yàn)結(jié)果之間的一致性程度,即推斷某測驗(yàn)所得分?jǐn)?shù)與同類標(biāo)準(zhǔn)測驗(yàn)所得分?jǐn)?shù)的相關(guān)程度。效標(biāo)關(guān)聯(lián)效度(criterion-relatedvalidity)的驗(yàn)證方法是指一個(gè)測驗(yàn)對于處于特定情境中的個(gè)體行為進(jìn)行預(yù)測時(shí)的有效性。(三)、效標(biāo)關(guān)聯(lián)效度及其驗(yàn)證方法1.效標(biāo)關(guān)聯(lián)效度的驗(yàn)證方法效標(biāo):檢驗(yàn)測驗(yàn)效度的外在的、客觀的標(biāo)準(zhǔn),即效度的標(biāo)準(zhǔn).效標(biāo)是足以顯示測驗(yàn)所欲測量的或要測量的特性的變量。效標(biāo):檢驗(yàn)測驗(yàn)效度的外在的、客觀的標(biāo)準(zhǔn),即效度的標(biāo)準(zhǔn).效標(biāo)是分類:同時(shí)效度:測驗(yàn)分?jǐn)?shù)與效標(biāo)資料的取得約在同一時(shí)間內(nèi)連續(xù)完成,這兩種資料的相關(guān)系數(shù)即為同時(shí)效度預(yù)測效度:在測驗(yàn)分?jǐn)?shù)取得一段時(shí)間后,才獲得效標(biāo)資料,計(jì)算這兩種資料間的相關(guān)系數(shù)即代表測驗(yàn)的預(yù)測效度。分類:效標(biāo)關(guān)聯(lián)效度的估計(jì)方法相關(guān)法直接計(jì)算測驗(yàn)分?jǐn)?shù)與效標(biāo)分?jǐn)?shù)的相關(guān)系數(shù)積差相關(guān)、等級相關(guān)、二列相關(guān)等顯著差異法根據(jù)效標(biāo)測量將被試分為兩個(gè)極端組,檢驗(yàn)這兩個(gè)組測驗(yàn)分?jǐn)?shù)是否具有統(tǒng)計(jì)學(xué)上的差異顯著性命中率當(dāng)測驗(yàn)用作取舍決策時(shí),常使用命中率相關(guān)概念:總命中率、正命中率、負(fù)命中率總命中率高,則測試的效度高例:70人參加的考試,通過測驗(yàn)選取了50人,淘汰了20人;選出的人中有40人合格,淘汰的人中有8人不合格。該測驗(yàn)的總命中率、正命中率和負(fù)命中率分別是多少?效標(biāo)關(guān)聯(lián)效度的估計(jì)方法相關(guān)法第四節(jié)項(xiàng)目的難度一、難度的含義難度是指測驗(yàn)項(xiàng)目的難易程度刻畫被試作答一個(gè)題目所遇到的困難程度的量數(shù),叫做題目的難度系數(shù),用符號P表示在教育測量中,P=正確回答試題的人數(shù)R/參加測驗(yàn)的總?cè)藬?shù)N二、難度的計(jì)算客觀試題(二分法記分):P=R/NR:答對該題的人數(shù);N:參加測驗(yàn)的總?cè)藬?shù)主觀題難度計(jì)算P=XK第四節(jié)項(xiàng)目的難度一、難度的含義P=XK教育測量與評價(jià)中題目(項(xiàng)目)的難度二、難度的計(jì)算客觀題的極端分組法根據(jù)測驗(yàn)分?jǐn)?shù)按高低排序,用兩個(gè)極端組(高分、低分)在某項(xiàng)目上的平均通過率表示項(xiàng)目的難度步驟:按測驗(yàn)總分由高到低排序從高分段向下選出全部試卷的27%作為高分組從低分段向上選出全部試卷的27%作為低分組按照上述公式計(jì)算項(xiàng)目難度值例:100人參加某測驗(yàn),高分組與低分組各取27人,其中第一題高分組20人答對,低分組10人答對。這道題的難度系數(shù)是多少?教育測量與評價(jià)中題目(項(xiàng)目)的難度二、難度的計(jì)算教育測量與評價(jià)中題目(項(xiàng)目)的難度二、難度的計(jì)算主觀題的極端分組法公式:步驟按測驗(yàn)總分依次排序,確定比例各為25%的高分組和低分組為高分組、低分組分別編制每題得分的分析表(試題分析表)用上述難度公式計(jì)算難度值教育測量與評價(jià)中題目(項(xiàng)目)的難度二、難度的計(jì)算教育測量與評價(jià)中題目(項(xiàng)目)的難度公式的含義:XH:高分組所得總分;XL:低分組所得總分;H:該題最高分;L:該題最低分;N:考生總?cè)藬?shù)的25%41040400521051578567642854088641000低分組1010100高分組XffxXffx試題分析表例:100名學(xué)生參加論文式測驗(yàn),按高、低分各占總?cè)藬?shù)的25%分組,其中第6題的得分統(tǒng)計(jì)表如下所示。求該題目的難度。教育測量與評價(jià)中題目(項(xiàng)目)的難度公式的含義:4教育測量與評價(jià)中題目(項(xiàng)目)的難度難度指出的僅僅是題目的相對難度,不能客觀地指出題目難度之間差異大小一般情況下,測驗(yàn)分?jǐn)?shù)呈正態(tài)分布教育測量與評價(jià)中題目(項(xiàng)目)的難度難度指出的僅僅是題目的相對教育測量與評價(jià)中題目(項(xiàng)目)的難度三、難度對測驗(yàn)的影響難度對測驗(yàn)分?jǐn)?shù)分布的影響過易、過難會造成測驗(yàn)分?jǐn)?shù)偏離正態(tài)分布,使測驗(yàn)分?jǐn)?shù)離散程度變小難度對測驗(yàn)鑒別力的影響測驗(yàn)的主要功效是鑒別考生實(shí)際水平的高低適宜難度可以加大考生得分的差異,從而提高測驗(yàn)的鑒別力項(xiàng)目難度的適宜值為0.5左右時(shí),測驗(yàn)得分的方差才可達(dá)最大值難度與測驗(yàn)?zāi)康牡年P(guān)系項(xiàng)目難度應(yīng)根據(jù)測驗(yàn)?zāi)康膩泶_定常模參照評價(jià):區(qū)分學(xué)生能力或成就的高低標(biāo)準(zhǔn)參照評價(jià):了解學(xué)生達(dá)到教學(xué)目標(biāo)規(guī)定的掌握程度教育測量與評價(jià)中題目(項(xiàng)目)的難度三、難度對測驗(yàn)的影響教育測量與評價(jià)中題目(項(xiàng)目)的區(qū)分度一、區(qū)分度的概念區(qū)分度是測驗(yàn)對被試實(shí)際水平的區(qū)分程度通常用D表示,取值范圍為+1.00至-1.00D越高時(shí),試題的質(zhì)量越好D為正時(shí),試題積極區(qū)分D為負(fù)時(shí),試題消極區(qū)分教育測量與評價(jià)中題目(項(xiàng)目)的區(qū)分度一、區(qū)分度的概念教育測量與評價(jià)中題目(項(xiàng)目)的區(qū)分度二、區(qū)分度計(jì)算方法極端分組法客觀性試題區(qū)分度的計(jì)算公式:D=PH-PL按測驗(yàn)總分從高到低排序確定測驗(yàn)總分最高的27%的被試作為高分組,最低的27%的被試為低分組分別求出這兩組被試通過試題的百分比將算得的有關(guān)數(shù)據(jù)帶入上公式教育測量與評價(jià)中題目(項(xiàng)目)的區(qū)分度二、區(qū)分度計(jì)算方法主觀性試題區(qū)分度的計(jì)算公式:說明:XH:高分組所得總分;XL:低分組所得總分;H:該題最高分;L:該題最低分;N:考生人數(shù)(總?cè)藬?shù)的25%)步驟:按測驗(yàn)總分由高到低排序;分別確定測驗(yàn)總分的25%、25%作為高低分組;列出試題分析表;將數(shù)據(jù)帶入以上公式加以計(jì)算主觀性試題區(qū)分度的計(jì)算公式:教育測量與評價(jià)中題目(項(xiàng)目)的區(qū)分度例:100名考生參加主觀性試題測驗(yàn),按高、低分各占人數(shù)的25%分組,其中第四題試題分析表如下所示,求該題目的區(qū)分度。41040428653063188648843210440106601200低分組1210120高分組XffxXffx試題分析表教育測量與評價(jià)中題目(項(xiàng)目)的區(qū)分度4教育測量與評價(jià)中題目(項(xiàng)目)的區(qū)分度三、區(qū)分度計(jì)算方法相關(guān)法考慮中間數(shù)據(jù)以項(xiàng)目分?jǐn)?shù)與效標(biāo)分?jǐn)?shù)的相關(guān)作為項(xiàng)目區(qū)分度的指標(biāo)(效標(biāo)分?jǐn)?shù)不易得到時(shí),以測驗(yàn)總分代替)相關(guān)越高,區(qū)分能力越好具體方法:積差相關(guān)法點(diǎn)二列相關(guān)二列相關(guān)Φ相關(guān)教育測量與評價(jià)中題目(項(xiàng)目)的區(qū)分度三、區(qū)分度計(jì)算方法積差相關(guān)法計(jì)算區(qū)分度非二分法記分的項(xiàng)目,可將題目得分與測驗(yàn)總分求積差相關(guān)系數(shù)以得到題目的區(qū)分度積差相關(guān)的另一計(jì)算公式:Sx為全體被試在某道題目上得分的標(biāo)準(zhǔn)差;Sy為全體被試總分的標(biāo)準(zhǔn)差;SD是由被試總分減去某題目得分而得到的新變量的方差
溫馨提示
- 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
- 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
- 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
- 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
- 5. 人人文庫網(wǎng)僅提供信息存儲空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負(fù)責(zé)。
- 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請與我們聯(lián)系,我們立即糾正。
- 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時(shí)也不承擔(dān)用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。
最新文檔
- 護(hù)理管理總結(jié)
- 腦癱的作業(yè)治療
- 護(hù)理三新項(xiàng)目實(shí)施路徑
- 核醫(yī)學(xué)科科室院感工作總結(jié)
- 2024屆江蘇省南京師范江寧分校中考數(shù)學(xué)猜題卷含解析
- 食品行業(yè)安全合規(guī)措施及服務(wù)
- 2025財(cái)富管理業(yè)務(wù)年終總結(jié)與未來計(jì)劃
- 金融服務(wù)行業(yè)風(fēng)險(xiǎn)質(zhì)量保證措施
- 化工安全基礎(chǔ)知識
- 骨科護(hù)理教學(xué)大賽課件
- 巖石破碎型泥水平衡頂管施工工法
- 新概念英語第1冊第2冊單詞帶音標(biāo)
- 健康養(yǎng)老照護(hù)課程設(shè)計(jì)
- 西藏拉薩市10校2025屆高考沖刺押題(最后一卷)歷史試卷含解析
- HG∕T 3657-2017 水處理劑異噻唑啉酮衍生物
- NBT 31021-2012風(fēng)力發(fā)電企業(yè)科技文件規(guī)檔規(guī)范
- 科學(xué)世界包含內(nèi)容
- 2023中信銀行北京分行交易銀行部產(chǎn)品經(jīng)理招聘筆試歷年典型考題及考點(diǎn)剖析附帶答案詳解
- 《兩辦意見》《八條硬措施》《煤礦安全生產(chǎn)條例》考試試題
- 2024年安徽省初中學(xué)業(yè)水平考試地理試卷(定心卷一)
- 水雨情在線監(jiān)測系統(tǒng)解決方案
評論
0/150
提交評論