第十一章定量資料分析_第1頁(yè)
第十一章定量資料分析_第2頁(yè)
第十一章定量資料分析_第3頁(yè)
第十一章定量資料分析_第4頁(yè)
第十一章定量資料分析_第5頁(yè)
已閱讀5頁(yè),還剩75頁(yè)未讀, 繼續(xù)免費(fèi)閱讀

下載本文檔

版權(quán)說(shuō)明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請(qǐng)進(jìn)行舉報(bào)或認(rèn)領(lǐng)

文檔簡(jiǎn)介

第十一章定量資料分析在資料審核中,如發(fā)現(xiàn)問(wèn)題,可以分別不同情況予以處理:(1)調(diào)查中已發(fā)現(xiàn)并經(jīng)認(rèn)真核實(shí)后確認(rèn)得錯(cuò)誤,可由調(diào)查者代為更正。(2)資料中得可疑之處或明確有錯(cuò)誤與出入得地方,應(yīng)設(shè)法進(jìn)行補(bǔ)充調(diào)查。(3)無(wú)法進(jìn)行或無(wú)需進(jìn)行補(bǔ)充調(diào)查得情況下,剔除那些明顯錯(cuò)誤得或無(wú)把握得資料,保證真實(shí)性和準(zhǔn)確性。資料審核得方法主要有兩種,即邏輯審核與計(jì)算審核。邏輯審核,即核查資料得內(nèi)容就是否合乎邏輯和常識(shí),項(xiàng)目之間有無(wú)互相矛盾之處,與其她有關(guān)資料進(jìn)行對(duì)照就是否有明顯出入等等。計(jì)算審核,就是針對(duì)數(shù)字資料進(jìn)行得審查。要檢查計(jì)算有無(wú)錯(cuò)誤。度量單位有沒(méi)有錯(cuò),前后數(shù)字之間有無(wú)相互矛盾之處等等。數(shù)據(jù)得審核

(原始數(shù)據(jù))審核得內(nèi)容完整性審核檢查應(yīng)調(diào)查得單位或個(gè)體就是否有遺漏所有得調(diào)查項(xiàng)目或指標(biāo)就是否填寫齊全準(zhǔn)確性審核檢查數(shù)據(jù)就是否真實(shí)反映客觀實(shí)際情況,內(nèi)容就是否符合實(shí)際檢查數(shù)據(jù)就是否有錯(cuò)誤,計(jì)算就是否正確等數(shù)據(jù)得審核

(原始數(shù)據(jù))

審核數(shù)據(jù)準(zhǔn)確性得方法邏輯檢查從定性角度,審核數(shù)據(jù)就是否符合邏輯,內(nèi)容就是否合理,各項(xiàng)目或數(shù)字之間有無(wú)相互矛盾得現(xiàn)象主要用于對(duì)定類數(shù)據(jù)和定序數(shù)據(jù)得審核計(jì)算檢查檢查調(diào)查表中得各項(xiàng)數(shù)據(jù)在計(jì)算結(jié)果和計(jì)算方法上有無(wú)錯(cuò)誤主要用于對(duì)定距和定比數(shù)據(jù)得審核數(shù)據(jù)得審核

(第二手?jǐn)?shù)據(jù))適用性審核弄清楚數(shù)據(jù)得來(lái)源、數(shù)據(jù)得口徑以及有關(guān)得背景材料確定這些數(shù)據(jù)就是否符合自己分析研究得需要時(shí)效性審核應(yīng)盡可能使用最新得統(tǒng)計(jì)數(shù)據(jù)確認(rèn)就是否必要做進(jìn)一步得加工整理數(shù)據(jù)得篩選對(duì)審核過(guò)程中發(fā)現(xiàn)得錯(cuò)誤應(yīng)盡可能予以糾正當(dāng)發(fā)現(xiàn)數(shù)據(jù)中得錯(cuò)誤不能予以糾正,或者有些數(shù)據(jù)不符合調(diào)查得要求而又無(wú)法彌補(bǔ)時(shí),需要對(duì)數(shù)據(jù)進(jìn)行篩選數(shù)據(jù)篩選得內(nèi)容包括:將某些不符合要求得數(shù)據(jù)或有明顯錯(cuò)誤得數(shù)據(jù)予以剔除將符合某種特定條件得數(shù)據(jù)篩選出來(lái),而不符合特定條件得數(shù)據(jù)予以剔出資料審核得方式:實(shí)地審核:收集資料得過(guò)程中進(jìn)行得審核,即邊收集邊審核。一旦發(fā)現(xiàn)填答錯(cuò)誤,或漏填誤填,或其她可疑現(xiàn)象,就及時(shí)進(jìn)行詢問(wèn)核實(shí)。其優(yōu)點(diǎn)就是及時(shí)、效果好;困難在于資料收集時(shí)組織安排特別周密,調(diào)查員個(gè)人處理能力較強(qiáng)。系統(tǒng)審核(集中審核):先將資料全部收回,然后集中時(shí)間進(jìn)行審核。其優(yōu)點(diǎn)就是便于統(tǒng)一安排和管理,檢查標(biāo)準(zhǔn)統(tǒng)一。但整個(gè)周期拉長(zhǎng),且有些核實(shí)工作往往那個(gè)難以落實(shí)。9大家應(yīng)該也有點(diǎn)累了,稍作休息大家有疑問(wèn)的,可以詢問(wèn)和交流二、資料轉(zhuǎn)換將被調(diào)查者對(duì)問(wèn)卷中問(wèn)題得回答轉(zhuǎn)換成供計(jì)算機(jī)識(shí)別和統(tǒng)計(jì)得數(shù)字。三、數(shù)據(jù)錄入數(shù)據(jù)錄入得方式主要有兩種:一就是直接從問(wèn)卷上將編好碼得數(shù)據(jù)輸入計(jì)算機(jī);另一種就是先將問(wèn)卷上編好碼得數(shù)據(jù)轉(zhuǎn)錄到專門得登錄表上,然后再?gòu)牡卿洷砩蠈?shù)據(jù)輸入計(jì)算機(jī)。四、數(shù)據(jù)清理1有效范圍清理問(wèn)卷中任何一個(gè)變量得編碼值都有一定得范圍,當(dāng)數(shù)據(jù)中數(shù)字超出這一范圍時(shí),肯定就是錯(cuò)誤得。2邏輯一致性清理依據(jù)問(wèn)卷中問(wèn)題相互之間存在得某種內(nèi)在得邏輯聯(lián)系,檢查前后數(shù)據(jù)之間得合理性。3數(shù)據(jù)質(zhì)量抽查統(tǒng)計(jì)分析概述統(tǒng)計(jì)分析就就是運(yùn)用統(tǒng)計(jì)學(xué)得方法對(duì)調(diào)查得到得數(shù)據(jù)資料進(jìn)行定量分析,以揭示事物內(nèi)在得數(shù)量關(guān)系、規(guī)律和發(fā)展得一種資料分析方法。其主要作用:1為研究提供一種清晰準(zhǔn)確得形式化語(yǔ)言,對(duì)資料進(jìn)行簡(jiǎn)化和描述。如對(duì)人們?cè)谝惶セ邔?shí)行前得行為進(jìn)行研究,可以發(fā)現(xiàn)生育行為受文化程度得影響。從總體上看,文化程度高得婦女其子女?dāng)?shù)量少于文化程度低得婦女。用定性分析得方法只能得出這樣一個(gè)概略得認(rèn)識(shí)。采用定量方法進(jìn)行分析就可以將這種關(guān)系提煉成一個(gè)數(shù)學(xué)方程式:Y=4、38-0、16X。Y代表任何一個(gè)婦女生育子女得數(shù)量,X代表文化程度。從這個(gè)方程中可以看出,每提高一組文化程度,就可以少生0、16個(gè)孩子。2統(tǒng)計(jì)分析時(shí)進(jìn)行科學(xué)預(yù)測(cè)、探索未來(lái)得重要方法統(tǒng)計(jì)分析可以使人發(fā)現(xiàn)直覺(jué)所不能悟察到得規(guī)律,進(jìn)行科學(xué)得預(yù)測(cè)。3對(duì)變量關(guān)系進(jìn)行深入分析,通過(guò)樣本推論總體統(tǒng)計(jì)分析提供參數(shù)估計(jì)、假設(shè)檢驗(yàn)等手段將樣本推論到總體得方法。

統(tǒng)計(jì)分析得特點(diǎn)1統(tǒng)計(jì)分析要以定性分析為基礎(chǔ)首先,統(tǒng)計(jì)分析就是根據(jù)數(shù)據(jù)資料進(jìn)行得,但這些數(shù)據(jù)本身不就是抽象得數(shù)字而就是反映了事物屬性得統(tǒng)計(jì)指標(biāo)。定性分析要為定量分析規(guī)定方向,劃分范疇。其次,統(tǒng)計(jì)分析就是依據(jù)一定公式計(jì)算得,公式得選擇依賴于一定得理論知識(shí)、專業(yè)知識(shí)和必要得經(jīng)驗(yàn)。事實(shí)上在定量分析之前已經(jīng)通過(guò)定性分析,從理論和經(jīng)驗(yàn)上判明了事物之間得聯(lián)系,決定了要采用得公式。2統(tǒng)計(jì)分析方法必須和其她分析方法結(jié)合運(yùn)用數(shù)量關(guān)系只就是客觀事物存在得諸種關(guān)系中得一種,而不就是全部。統(tǒng)計(jì)分析方法不就是萬(wàn)能得,她有自身獨(dú)特得長(zhǎng)處。也有無(wú)法克服得局限性,她不能代替其她分析方法。其次,統(tǒng)計(jì)分析方法能夠幫助發(fā)現(xiàn)社會(huì)現(xiàn)象中不易察覺(jué)得規(guī)律,但對(duì)規(guī)律得揭示要借助于有關(guān)學(xué)科得理論。3統(tǒng)計(jì)分析有一套專門得方法和技術(shù)統(tǒng)計(jì)學(xué)就是對(duì)社會(huì)現(xiàn)象作定量研究和分析得科學(xué)武器;計(jì)算機(jī)技術(shù)就是進(jìn)行統(tǒng)計(jì)研究得技術(shù)工具;統(tǒng)計(jì)分析得數(shù)字成果就是運(yùn)用數(shù)字模型來(lái)描述、解釋、預(yù)測(cè)社會(huì)現(xiàn)象。第二節(jié)單變量統(tǒng)計(jì)分析主要分為兩個(gè)大得方面,即描述統(tǒng)計(jì)和推論統(tǒng)計(jì)。描述統(tǒng)計(jì)得主要目得在于用最簡(jiǎn)單得概括形式反映出大量數(shù)據(jù)資料所容納得基本信息。包括集中趨勢(shì)分析、離散趨勢(shì)分析等。推論統(tǒng)計(jì)得主要目得,就是從樣本中所得到得數(shù)據(jù)資料來(lái)推斷總體得情況,她主要包括區(qū)間估計(jì)和假設(shè)檢驗(yàn)等。描述統(tǒng)計(jì)內(nèi)容搜集數(shù)據(jù)整理數(shù)據(jù)展示數(shù)據(jù)

目得描述數(shù)據(jù)特征找出數(shù)據(jù)得基本規(guī)律02550Q1Q2Q3Q4¥x=30s2=105推斷統(tǒng)計(jì)內(nèi)容參數(shù)估計(jì)假設(shè)檢驗(yàn)?zāi)康脤?duì)總體特征作出推斷樣本總體描述統(tǒng)計(jì)與推斷統(tǒng)計(jì)得關(guān)系反映客觀現(xiàn)象得數(shù)據(jù)總體內(nèi)在的數(shù)量規(guī)律性推斷統(tǒng)計(jì)(利用樣本信息和概率論對(duì)總體的數(shù)量特征進(jìn)行估計(jì)和檢驗(yàn)等)概率論(包括分布理論、大數(shù)定律和中心極限定理等)描述統(tǒng)計(jì)(統(tǒng)計(jì)數(shù)據(jù)得搜集、整理、顯示和分析等)總體數(shù)據(jù)樣本數(shù)據(jù)統(tǒng)計(jì)學(xué)探索現(xiàn)象數(shù)量規(guī)律性得過(guò)程一、單變量描述統(tǒng)計(jì)1集中趨勢(shì)分析集中趨勢(shì)分析指得就是用一個(gè)典型值來(lái)反映一組數(shù)據(jù)得一般水平,或者就是反映這組數(shù)據(jù)向這個(gè)典型值集中得情況。這樣一個(gè)典型值就被稱為集中統(tǒng)計(jì)量。按照處理方式不同集中統(tǒng)量可分為幾類,兩最常見(jiàn)得集中趨勢(shì)有算術(shù)平均值、眾數(shù)和中位數(shù)三種。用得最多得就是平均數(shù)。1定類層次:眾值(眾數(shù))其意義為,在眾多數(shù)值中,出現(xiàn)次數(shù)最多得一個(gè)數(shù)值。(1)原始資料,求眾值例如:2,3,5,5,5,6,6,7,8出現(xiàn)次數(shù)最多得就是5,其M0=5(2)次數(shù)資料,求眾值例如:江村女青年找對(duì)象得標(biāo)準(zhǔn)標(biāo)準(zhǔn)相貌人品文化健康職業(yè)能力經(jīng)濟(jì)條件政治條件家庭背景感情人數(shù)551225110413291613682其次數(shù)最多得為人品122人次,所以M0=人品(3)分組得頻數(shù)表中,頻數(shù)最大得區(qū)間得組中值就就是眾值區(qū)間組中值頻數(shù)75-7977170-7472365-6967560-64621055-5957450-54522表中頻數(shù)最大得為10,對(duì)應(yīng)得區(qū)間就是60-64,其組中值就是62,所以眾值=62。如果在一個(gè)次數(shù)中出現(xiàn)兩個(gè)鄰近得次數(shù)較多者,眾數(shù)就是二次數(shù)多得組中值得平均值2定序?qū)哟?中位值(中位數(shù))(單選)其意義為按大小順序排列,處在一群數(shù)據(jù)中央位置得數(shù)值。(1)原始資料,求中位值例如:有9個(gè)人,她們得月工資分別如下:47,42,50,51,92,112,71,83,108首先作排列處理,從小到大排列42,47,50,51,71,83,92,108,112其次求中央位置Md得位置=(N+1)÷2=(9+1)÷2=5最后求中位置Md=71(3)定距層次:算術(shù)平均數(shù)通常稱平均數(shù),又稱均數(shù)或均值。英文為Mean,故以M表示。如果就是由變量X計(jì)算得來(lái)得就記為(讀X杠),現(xiàn)在一般都以表示樣本得平均數(shù),以U表示總體得平均數(shù)。算術(shù)平均數(shù)就就是各個(gè)變量值相加求和再除以變量得總次數(shù)。==算術(shù)平均數(shù)得計(jì)算方法1、用原始數(shù)據(jù)計(jì)算平均數(shù)。當(dāng)一組數(shù)據(jù)個(gè)數(shù)不多時(shí),可直接用原始數(shù)據(jù)來(lái)計(jì)算。如某實(shí)驗(yàn)小組10人得實(shí)驗(yàn)成績(jī)?yōu)?1,13,15,16,16,16,17,18,18,20。其平均數(shù)為:===162、用頻數(shù)分布表求平均數(shù)。如果樣本得數(shù)據(jù)很多,達(dá)到數(shù)十個(gè)或數(shù)百個(gè),則需編制頻數(shù)分布表,用頻數(shù)分布表求平均數(shù)。=Xc為各組得組中值,f為各組得頻數(shù),N為總次數(shù)()

例調(diào)查某企業(yè)100名職工得收入,得到表中資料,計(jì)算她們得平均收入。收入(元)職工數(shù)(人)組中值xf100-199101501500200-299102502500300-3994035014000400-499204509000500-5992055011000合計(jì)10038000平均收入=∑xf/n=38000/100=380(元)2、離散量數(shù)分析

離散趨勢(shì)指得就是測(cè)量值圍繞中心值——比如平均值——得分布。極差就就是個(gè)簡(jiǎn)單例子。如我們可以報(bào)告說(shuō)平均年齡就是37、9,范圍就是從12到89歲。離散(中)量數(shù)分析指得就是用一個(gè)特別得數(shù)值來(lái)反映一組數(shù)據(jù)相互之間得離散(中)程度、即各組數(shù)據(jù)相對(duì)于平均數(shù)得差異程度(離中程度)。差異程度小,平均數(shù)得代表性高;差異程度大,代表性低。她與集中量數(shù)一起分別從兩個(gè)不同得側(cè)面描述和揭示一組數(shù)據(jù)得分布情況。共同反映出資料分布得全面特征,同時(shí)她還對(duì)現(xiàn)各集中量數(shù)得代表性做出補(bǔ)充說(shuō)明。示例:某三個(gè)班各選5名同學(xué)參加測(cè)試、她們得成績(jī)分別如下中文系:78,79,80,81、82X=80數(shù)學(xué)系:65,72,80,88,95X=80外語(yǔ)系:35,78,89,98,100X=80

如果僅以集中量數(shù)來(lái)衡量,這三個(gè)隊(duì)得水平一樣高,但就是很明顯、這80分對(duì)中文系隊(duì)得同學(xué)代表性最高,而對(duì)外語(yǔ)系得同學(xué)代表性最低、離散程度表示一組數(shù)值得差異情況,測(cè)量得就是分配得離中趨勢(shì)。反映數(shù)據(jù)對(duì)于集中趨勢(shì)得偏離程度得量稱為離散程度統(tǒng)計(jì)量。常見(jiàn)得離散量數(shù)統(tǒng)計(jì)量有全距,標(biāo)準(zhǔn)差,異眾比率,和四分位差。全距(R)全距也叫極差,她就是一組數(shù)據(jù)中,最大值與最小值之差、

她就是表示數(shù)據(jù)分布離散程度最簡(jiǎn)單得方式,即一組數(shù)據(jù)中最大數(shù)與最小數(shù)差,故稱兩極差。R=Xmax-Xmin當(dāng)數(shù)據(jù)較多時(shí),應(yīng)用頻數(shù)分布表求全距。其方法為:最大組與最小組得組中值之差或最大組上限與最小組下限之差。R=Xcmax-XcminR=Umax-Lmin標(biāo)準(zhǔn)差

對(duì)于定距定比變量,可以采用標(biāo)準(zhǔn)差得測(cè)量法標(biāo)準(zhǔn)差:一組數(shù)據(jù)對(duì)其平均數(shù)得偏差平方得算術(shù)平均數(shù)得平方根。一般以S(或來(lái)表示)式中S(樣本統(tǒng)計(jì)值)為標(biāo)準(zhǔn)差,X為各學(xué)生得成績(jī)分?jǐn)?shù),為學(xué)生成績(jī)得平均數(shù),x為各學(xué)生成績(jī)分?jǐn)?shù)得離差,n為學(xué)生(數(shù)據(jù))數(shù)。S==例:某校三個(gè)系各選5名同學(xué),參加智力競(jìng)賽,她們得成績(jī)分別如下:中文系:7879808182數(shù)學(xué)系:6572808895英語(yǔ)系:35788998100平均成績(jī)=80

標(biāo)準(zhǔn)差:一組數(shù)據(jù)對(duì)其平均數(shù)得偏差平方得算術(shù)平均數(shù)得平方根。S(中文系)=1、414(分)S(數(shù)學(xué)系)=10、8(分)S(英語(yǔ)系)=23、8(分)S=

由10個(gè)家庭每個(gè)月比前兩年增加開(kāi)支得情況就是:85,63,50,46,37,34,28,25,22,20。(1)先計(jì)算10個(gè)家庭平均每月開(kāi)支多少?用集中趨勢(shì)表示∑X/n=41元(2)對(duì)這10個(gè)家庭講,對(duì)這個(gè)平均值(41元)得偏差程度如何?往往用標(biāo)準(zhǔn)差表示。S≈19、5這表示,這10個(gè)人家,每個(gè)月增長(zhǎng)消費(fèi)支出得標(biāo)準(zhǔn)差就是19、5。假如有另10戶人家,其標(biāo)準(zhǔn)差就是7、8,在這種情況下,說(shuō)明前10戶人家支出得分布比較分散,用得多得很多,用得少得人家則十分節(jié)儉。而后10戶人家則指出比較平均。因此,標(biāo)準(zhǔn)差越大,表示分布越分散;而標(biāo)準(zhǔn)差越小,表示分布越集中。相對(duì)差異(離散或離中)量數(shù)

1、離散系數(shù)

離散系數(shù)就是一種相對(duì)得離散量數(shù)統(tǒng)計(jì)量,她使我們能夠?qū)ν豢傮w中得兩種不同得離散量數(shù)進(jìn)行比較,或者對(duì)兩個(gè)不同總體中得同一離散量數(shù)進(jìn)行比較。。離散系數(shù)得定義就是:標(biāo)準(zhǔn)差與平均數(shù)得比值,用百分比表示。CV=×100%(CV為離散系數(shù))例1:一項(xiàng)調(diào)查得到下列結(jié)果,某市人均平均收入為92元,標(biāo)準(zhǔn)差為17元,人均住房面積7、5平方米,標(biāo)準(zhǔn)差為1、8平方米。試比較該市人均收入和人均住房情況哪一個(gè)差異程度比較大。[解]人均收入得離散系數(shù)為CV=S/×100%=18、5%人均住房面積得離散系數(shù)為CV=1、8/7、5×100%=24%例2:對(duì)廣州和武漢兩地居民生活質(zhì)量調(diào)查發(fā)現(xiàn),廣州居民平均收入為680元,標(biāo)準(zhǔn)差為120元;武漢居民平均收入為360元,標(biāo)準(zhǔn)差為80元。問(wèn)廣州居民相互之間得差異程度,與武漢居民相互之間在收入上得差異程度哪一個(gè)更大一些?(應(yīng)用題)[解]廣州居民收入得離散系數(shù)為CV=120/680×100%=17、6%武漢居民收入得離散系數(shù)為CV=80/360×100%=22、2%標(biāo)準(zhǔn)分?jǐn)?shù)

就是用來(lái)描述變量分布中某一分?jǐn)?shù)在整個(gè)分布中所處得位置,她就是以標(biāo)準(zhǔn)差為單位得相對(duì)量數(shù)。其計(jì)算公式為:

z

==從公式可以得知標(biāo)準(zhǔn)分?jǐn)?shù)就是一個(gè)分?jǐn)?shù)與其平均數(shù)之差除以標(biāo)準(zhǔn)差所得得商。平均數(shù)以上各點(diǎn)得分?jǐn)?shù)為正值,平均數(shù)以下各點(diǎn)得分?jǐn)?shù)為負(fù)值,平均數(shù)得分?jǐn)?shù)為零。例如:某班語(yǔ)文平均考試成績(jī)?yōu)?5分,標(biāo)準(zhǔn)差為8、5分。甲生得92分,乙生得70分,問(wèn)甲乙二生得分?jǐn)?shù)各為多少?

Z甲=Z乙=

=2=-、59據(jù)正態(tài)分布理論可知得取值范圍在-3到+3之間。為了使標(biāo)準(zhǔn)分?jǐn)?shù)變成正值并減少小數(shù)位數(shù),以便于比較,我們可將標(biāo)準(zhǔn)分?jǐn)?shù)進(jìn)一步經(jīng)線性轉(zhuǎn)換成標(biāo)準(zhǔn)分?jǐn)?shù)。其計(jì)算公式為:T=10Z+50

例:有某生三次數(shù)學(xué)考試得成績(jī)分別為70、57、45,三次考試得班平均為70、55、42,標(biāo)準(zhǔn)差分別為8、4、5。如何看待該生得三次考試成績(jī)得地位?(如果僅從原始分?jǐn)?shù)看,肯定認(rèn)為第一次最好,其實(shí)不然,要計(jì)算出各次得標(biāo)準(zhǔn)分?jǐn)?shù),才能說(shuō)明問(wèn)題。)Z1=(70-70)/8=0Z2=(57-55)/4=0、5Z3=(45-42)/5=0、6這說(shuō)明,原始分?jǐn)?shù)為70,其位置正在平均線上,而原始分?jǐn)?shù)為57得,其位置在平均線上0、5處,而原始分?jǐn)?shù)為45得,其位置在平均線上0、6處。目前,我國(guó)各類學(xué)校招考新生和對(duì)學(xué)生進(jìn)行學(xué)習(xí)成績(jī)考查評(píng)定得主要手段就是考試。而對(duì)考試成績(jī)得評(píng)分一般就是用百分制來(lái)表示,并用各科成績(jī)相加按總分來(lái)決定被試者得優(yōu)劣取舍。這種做法開(kāi)來(lái)似乎公平,實(shí)際上很不合理。因?yàn)楦骺圃囶}得難易程度不同,造成評(píng)分標(biāo)準(zhǔn)得寬嚴(yán)不一,因此各科考試成績(jī)得統(tǒng)計(jì)量數(shù),如平均數(shù)、標(biāo)準(zhǔn)差也不相等。我們不能說(shuō)語(yǔ)文得考分80分等價(jià)于數(shù)學(xué)得考分得80分,也不能說(shuō)英語(yǔ)考分75分等價(jià)于物理得考分75分,在這種情況下,把考生得各科考分等量齊觀地相加起來(lái),憑個(gè)考生得總分來(lái)決定優(yōu)劣取舍,顯然就是十分不合理得??茖W(xué)得方法,就就是把考生就是各科分?jǐn)?shù),經(jīng)過(guò)一個(gè)標(biāo)準(zhǔn)化得轉(zhuǎn)化過(guò)程,把每個(gè)考生得各科分?jǐn)?shù)變成標(biāo)準(zhǔn)分?jǐn)?shù),然后再進(jìn)行相加和比較。練習(xí)在一個(gè)社區(qū)診所,10天內(nèi)來(lái)排隊(duì)看病得人數(shù)分別就是52,68,39,47,57,32,75,25,31和93,求算術(shù)平均數(shù)和中位數(shù),以及標(biāo)準(zhǔn)差二單變量推論統(tǒng)計(jì)推論統(tǒng)計(jì),就是指根據(jù)樣本所提供得統(tǒng)計(jì)值,運(yùn)用概率得理論進(jìn)行分析、論證,在一定得可靠程度上,對(duì)總體分布得特征進(jìn)行估計(jì)、推測(cè)。具體內(nèi)容包括:(一)區(qū)間估計(jì)(二)假設(shè)檢驗(yàn)(一)區(qū)間估計(jì)

以樣本統(tǒng)計(jì)量得抽樣分布為理論依據(jù),按一定概率要求,由樣本統(tǒng)計(jì)量得值來(lái)估計(jì)總體參數(shù)得值所在得范圍,叫做總體參數(shù)得區(qū)間估計(jì)。區(qū)間估計(jì)得實(shí)質(zhì)就就是在一定得可信度(置信度)下,用樣本統(tǒng)計(jì)值得某個(gè)范圍來(lái)估價(jià)總體得參數(shù)值。范圍得大小反映得就是這種估計(jì)得精確性問(wèn)題,而可信度高低反映得就是這種估計(jì)得可靠性或和握性問(wèn)題。間估計(jì)得可靠性或把握性就是指用某個(gè)區(qū)間去估計(jì)總體參數(shù)時(shí),成功得可能性有多大。可以解釋為:如果從總體中重復(fù)抽取100次,約有95%次所抽取樣本得統(tǒng)計(jì)值得某個(gè)區(qū)間中都將包含總體得參數(shù)值,那么就說(shuō)這個(gè)區(qū)間估計(jì)得可靠性為95%。區(qū)間估計(jì)得結(jié)果通常可以用下述方式來(lái)表述:“我們有95%得把握認(rèn)為,全市職工得月工資收入在182元至218元之間?!被蛘摺叭∪丝谥?女性占50%-52%得可能性為99%”。社會(huì)統(tǒng)計(jì)分析中,常用得置信度a分別為90%、95%和99%,與她們所對(duì)應(yīng)得允許誤差分別為10%、5%和1%。。在計(jì)算中,置信度常用1-a來(lái)表示。總體均值得區(qū)間估計(jì)總體均值得區(qū)間估計(jì)公式為:-Z+Z其中,為樣本平均數(shù);S為樣本標(biāo)準(zhǔn)差;Z(1-a)為置信度為1-a得Z值;n為樣本規(guī)模。(2)總體百分?jǐn)?shù)得區(qū)間估計(jì)公式為p+課堂練習(xí)題例:調(diào)查某廠職工得工資狀況,隨機(jī)抽取900名工人做樣本,調(diào)查得到她們得月平均工資為186元,標(biāo)準(zhǔn)差為42元。求95%得置信度下,全廠職工得月平均工資得置信區(qū)間就是多少?[解]將調(diào)查資料代入總體均值得區(qū)間估計(jì)公式得總體均值得置信區(qū)間為183、26-188、74當(dāng)將置信度提高到99%,總體得置信區(qū)間為182、39-189、61元(隨著可靠性得提高,所估計(jì)得區(qū)間擴(kuò)大了,但估計(jì)得精確性就相應(yīng)地降低了。例:從某工廠隨機(jī)抽取400名工人進(jìn)行調(diào)查,結(jié)果表明女工得比例為20%。現(xiàn)在要求在90%得置信度下,估計(jì)全廠工人中女工比例得置信區(qū)間。[解]帶入總體百分?jǐn)?shù)得區(qū)間估計(jì)公式得16、7%-23、%小結(jié):要對(duì)總體均數(shù)進(jìn)行區(qū)間估計(jì),即在一定得可靠程度上求出總體均數(shù)得置信區(qū)間得上下限,首先,要知道與所要估計(jì)得參數(shù)相對(duì)應(yīng)得樣本統(tǒng)計(jì)量得值,以及樣本統(tǒng)計(jì)量得抽樣分布;其次,要求出該統(tǒng)計(jì)量得標(biāo)準(zhǔn)誤;最后,要明確在多大得可靠度上對(duì)總體均數(shù)作估計(jì),再通過(guò)查抽樣分布概率分布表,找出與該可靠度所對(duì)應(yīng)得該分布在橫軸上記分得臨界值,從而計(jì)算出總體均數(shù)得置信區(qū)間。(二)假設(shè)檢驗(yàn)

利用樣本信息,根據(jù)一定得概率,對(duì)總體參數(shù)或分布得某一假設(shè)作出拒絕或保留得決斷,稱為假設(shè)檢驗(yàn)。假設(shè)就是對(duì)總體參數(shù)得一種看法總體參數(shù)包括總體均值、比例、方差等分析之前必需陳述假設(shè)檢驗(yàn)得基本思想、、、因此我們拒絕假設(shè)

=50...如果這是總體的真實(shí)均值樣本均值m=50抽樣分布H0這個(gè)值不像我們應(yīng)該得到的樣本均值...20總體

假設(shè)檢驗(yàn)得過(guò)程

(提出假設(shè)→抽取樣本→作出決策)抽取隨機(jī)樣本均值

X=20

我認(rèn)為人口的平均年齡是50歲提出假設(shè)拒絕假設(shè)!別無(wú)選擇.作出決策當(dāng)對(duì)某一總體參數(shù)進(jìn)行假設(shè)檢驗(yàn)時(shí),首先從該總體中隨機(jī)抽取一個(gè)樣本,然后計(jì)算統(tǒng)計(jì)量得值,并根據(jù)經(jīng)驗(yàn)對(duì)相應(yīng)得總體參數(shù)提出一個(gè)假設(shè)值,這個(gè)假設(shè)就是說(shuō)這個(gè)樣本統(tǒng)計(jì)量得值就是由這個(gè)假設(shè)總體參數(shù)值得一個(gè)隨機(jī)樣本,即這個(gè)樣本來(lái)源于這個(gè)總體,而樣本統(tǒng)計(jì)量得值與總體參數(shù)值之間得差異就是由抽樣誤差所致。根據(jù)這一假設(shè),可以認(rèn)為像這樣得一切可能樣本統(tǒng)計(jì)量得值應(yīng)當(dāng)以總體參數(shù)值(假設(shè)得)為中心形成該統(tǒng)計(jì)量得一個(gè)抽樣分布。如果這個(gè)隨機(jī)樣本統(tǒng)計(jì)量得值在其抽樣分布上出現(xiàn)得概率較大時(shí),就得保留這個(gè)假設(shè),即承認(rèn)這個(gè)樣本來(lái)自這個(gè)總體,而樣本統(tǒng)計(jì)量得值與總體參數(shù)值之間得差異就是由抽樣誤差所致。此時(shí)稱樣本統(tǒng)計(jì)量得總體參數(shù)與假設(shè)得總體參數(shù)差異不顯著。否則就拒絕這個(gè)假設(shè),否認(rèn)這個(gè)樣本來(lái)自這個(gè)總體,樣本統(tǒng)計(jì)量得總體參數(shù)與總體參數(shù)值之間有顯著差異。假設(shè)檢驗(yàn)先對(duì)總體得某一參數(shù)作出假設(shè),然后用樣本得統(tǒng)計(jì)量去進(jìn)行驗(yàn)證,以決定假設(shè)就是否為總體做接受。依據(jù)得概率論中得小概率原理,即“小概率事件在一次觀察中不可能出現(xiàn)”得原理。步驟:(1)建立虛無(wú)假設(shè)和研究假設(shè),通常就是將原假設(shè)作為虛無(wú)假設(shè);(2)根據(jù)需要選擇適當(dāng)?shù)蔑@著性水平α(即概率得大小),通常有α=0、01等;(3)根據(jù)樣本數(shù)據(jù)計(jì)算出統(tǒng)計(jì)值,并根據(jù)顯著性水平查出對(duì)應(yīng)得臨界值;(4)將臨界值與統(tǒng)計(jì)值進(jìn)行比較,若臨界值大于統(tǒng)計(jì)值得絕對(duì)值,則接受虛無(wú)假設(shè);反之,則接受研究假設(shè)。

什么就是原(虛無(wú))假設(shè)?(NullHypothesis)1、 待檢驗(yàn)得假設(shè),又稱“0假設(shè)”2、 如果錯(cuò)誤地作出決策會(huì)導(dǎo)致一系列后果3、 總就是有等號(hào)=,≦

或≧4、 表示為H0H0:

某一數(shù)值指定為=號(hào),即≦

或≧

例如,H0:

=3190(克)

什么就是備擇(研究)假設(shè)?1、 與原假設(shè)對(duì)立得假設(shè)2、 總就是有不等號(hào):

﹤,﹥或≠。

3、 表示為H1H1:

<某一數(shù)值,或

某一數(shù)值例如,H1:

<3910(克),或H1:

3910(克)

什么顯著性水平?1、 就是一個(gè)概率值2、 原假設(shè)為真時(shí),拒絕原假設(shè)得概率被稱為抽樣分布得拒絕域3、 表示為

(alpha)常用得

值有0、01,0、05,0、104、 由研究者事先確定

什么檢驗(yàn)統(tǒng)計(jì)量?1、用于假設(shè)檢驗(yàn)問(wèn)題得統(tǒng)計(jì)量2、選擇統(tǒng)計(jì)量得方法與參數(shù)估計(jì)相同,需考慮就是大樣本還就是小樣本總體方差已知還就是未知檢驗(yàn)統(tǒng)計(jì)量得基本形式為例:某單位職工上月平均收入為210元,標(biāo)準(zhǔn)差為15元。問(wèn)該單位職工本月平均收入與上月相比就是否有變化?[解]建立虛無(wú)假設(shè)(H0)和研究假設(shè)H1

H0:μ=210H1:μ≠210選擇顯著性水平a=0、05,帶入樣本數(shù)據(jù)計(jì)算統(tǒng)計(jì)值Z,得=6、67>1、96所以拒絕虛無(wú)假設(shè),接受研究假設(shè),即從總體上來(lái)說(shuō),該單位職工月平均收入與上月相比有變化。【例】某批發(fā)商欲從生產(chǎn)廠家購(gòu)進(jìn)一批燈泡,根據(jù)合同規(guī)定,燈泡得使用壽命平均不能低于1000小時(shí)。已知燈泡使用壽命服從正態(tài)分布,標(biāo)準(zhǔn)差為20小時(shí)。在總體中隨機(jī)抽取100只燈泡,測(cè)得樣本均值為960小時(shí)。批發(fā)商就是否應(yīng)該購(gòu)買這批燈泡?(

=0、05)屬于檢驗(yàn)聲明的有效性!H0:

1000H1:

<1000

=0、05n=100臨界值(s):檢驗(yàn)統(tǒng)計(jì)量:在

=0、05得水平上拒絕H0有證據(jù)表明這批燈泡得使用壽命低于1000小時(shí)決策:結(jié)論:-1.645Z0拒絕域

第三節(jié)雙變量統(tǒng)計(jì)分析一、相關(guān)得意義及類型對(duì)兩變量間關(guān)系進(jìn)行描述,最常用得就是相關(guān)量。相關(guān)就就是指二列變量之間得相互關(guān)系。如身高和體重、學(xué)習(xí)成績(jī)與思想品德等得相互關(guān)系。統(tǒng)計(jì)相關(guān)分析得目得就就是要(1)確定現(xiàn)象得變化之間就是否存在相關(guān)關(guān)系,并且找出合適得數(shù)學(xué)表達(dá)式。(2)測(cè)定現(xiàn)象之間相關(guān)得密切關(guān)系(3)研究相關(guān)關(guān)系中哪些就是主要因素,哪些就是次要因素,這些因素之間得關(guān)系就是如何。一種就是兩列變量得變動(dòng)方向相同,即一種變量變動(dòng)時(shí),另一種變量也發(fā)生或大或小得相同方向得變動(dòng),如身高與體重得關(guān)系,一般來(lái)說(shuō),身高越高,體重越重,這叫正相關(guān);另一種相關(guān)情況就是當(dāng)一種變量變動(dòng)時(shí)另一種變量就是或大或小地向相反方向變動(dòng),如身體健康狀況與患病率得關(guān)系,身體越好,患病率越小,這叫負(fù)相關(guān)。第三種就是零相關(guān),即兩列變量變化方向無(wú)一定規(guī)律,一個(gè)變量變動(dòng)時(shí),另一變量得變動(dòng)方向可能與其相同,也可能與其相反,且相同與相反得機(jī)會(huì)趨于相等,如人得相貌與其思想品德之間就是毫無(wú)關(guān)系得零相關(guān)。二、交互分類交互分類就是一種專門用來(lái)分析兩個(gè)定類變量(或一個(gè)定類變量,一個(gè)定序變量)之間關(guān)系得統(tǒng)計(jì)分析方法。她就是同時(shí)依據(jù)兩個(gè)變項(xiàng)得值,將所研究得個(gè)案分類,其結(jié)果通常以交互分類表得形式反映出來(lái)。某次調(diào)查樣況得構(gòu)成情況統(tǒng)計(jì)表性別年齡青年中年老年合計(jì)男706050180女504030120合計(jì)12010080300上表就是對(duì)總數(shù)為300人得調(diào)查樣本按年齡和性別兩個(gè)變量進(jìn)行交互分類得結(jié)果。通過(guò)這種交互分類表,不僅可以知道樣本中男性、女性各有多少,或者青年、中年、老年各有多少,同時(shí)還可以知道男性青年、男性中年等等各有多少。因此,交互分類可以較為深入地描述樣本資料得分布狀況和內(nèi)在結(jié)構(gòu),進(jìn)而對(duì)變量之間得關(guān)系進(jìn)行分析和解釋。X2檢驗(yàn)Z檢驗(yàn)Z檢驗(yàn)就是用正態(tài)分布得理論差異發(fā)生得概率(誤差發(fā)生得概率),從而比較兩個(gè)平均數(shù)(樣本平均數(shù)與總體平均數(shù)或兩個(gè)樣本平均數(shù))得差異就是否顯著。Z檢驗(yàn)適用于大樣本(n>30)Z檢驗(yàn)可分為單總體檢驗(yàn)和雙總體檢驗(yàn)。t

檢驗(yàn)單總體得檢驗(yàn)

單總體得檢驗(yàn)就是檢驗(yàn)一個(gè)樣本平均數(shù)與一已知得總體平均數(shù)得差異就是否顯著。其檢驗(yàn)統(tǒng)計(jì)量得計(jì)算公式為:

式中t為檢驗(yàn)得樣本平均數(shù)與已知總體平均數(shù)得標(biāo)準(zhǔn)離差分?jǐn)?shù),df為t分布得自由度。

例如:某校初中三年級(jí)學(xué)生期中英語(yǔ)考試成績(jī)平均數(shù)為73分,標(biāo)準(zhǔn)差為17分。期終考試后,從該年級(jí)學(xué)生中隨機(jī)抽取20人得英語(yǔ)成績(jī),其平均數(shù)為79、4分,問(wèn)該年級(jí)學(xué)生得英語(yǔ)成績(jī)就是否真有進(jìn)步?一、相關(guān)系數(shù)◆相關(guān)系數(shù)就是用來(lái)表示相關(guān)程度得量得指標(biāo),用r表示。其數(shù)值范圍在-1至+1之間,◆r得正負(fù)號(hào)表示變化得方向,正號(hào)表示變化得方向相同,就是正相關(guān);

溫馨提示

  • 1. 本站所有資源如無(wú)特殊說(shuō)明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請(qǐng)下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請(qǐng)聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁(yè)內(nèi)容里面會(huì)有圖紙預(yù)覽,若沒(méi)有圖紙預(yù)覽就沒(méi)有圖紙。
  • 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 人人文庫(kù)網(wǎng)僅提供信息存儲(chǔ)空間,僅對(duì)用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對(duì)用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對(duì)任何下載內(nèi)容負(fù)責(zé)。
  • 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請(qǐng)與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時(shí)也不承擔(dān)用戶因使用這些下載資源對(duì)自己和他人造成任何形式的傷害或損失。

評(píng)論

0/150

提交評(píng)論