《應(yīng)用統(tǒng)計分析》word版_第1頁
《應(yīng)用統(tǒng)計分析》word版_第2頁
《應(yīng)用統(tǒng)計分析》word版_第3頁
《應(yīng)用統(tǒng)計分析》word版_第4頁
《應(yīng)用統(tǒng)計分析》word版_第5頁
已閱讀5頁,還剩10頁未讀, 繼續(xù)免費閱讀

下載本文檔

版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請進行舉報或認領(lǐng)

文檔簡介

1、.天馬行空官方博客: ;QQ:1318241189;QQ群:175569632應(yīng)用統(tǒng)計分析部分第一章:抽樣分布與設(shè)計一、抽樣分布1、抽樣的特點抽樣的目的是用被抽取部分個體所求得的數(shù)值推斷總體的數(shù)量特征。其中,抽取部分個體稱為總體的一個樣本 。特別樣本個數(shù)就是樣本容量;樣本取值就是樣本觀察值。抽樣是對所研究的總體,按照隨機原則抽取部分個體進行的調(diào)查。抽樣的特點:隨機原則:每個元素(或個體)有同等抽中的機會(具有代表性) 推斷總體特征:樣本的數(shù)值特征推斷總體數(shù)量特征。 推斷的精確性:把推斷的誤差控制在一定的精確度內(nèi)(可靠性要求)2、樣本平均數(shù)的分布正態(tài)總體分布:如果從正態(tài)分布總體N(,)中隨機抽取

2、樣本,則樣本平均數(shù)的分布具有如下性質(zhì):a:樣本的平均數(shù)的分布也是正態(tài)分布。b:樣本的平均數(shù)的平均數(shù)等于總體的平均數(shù)c: 當從無限總體抽樣(或從有限總體采用放回抽樣)時,樣本平均數(shù)分布的方差等于總體的方差除以樣本容量。即特別:當從有限總體不放回抽樣時,樣本平均數(shù)分布方差為:();簡記(1-)總結(jié):樣本平均數(shù)服從正態(tài)分布:N(,)非正態(tài)總體分布:如果總體不服從正態(tài)分布時,樣本平均數(shù)分布性質(zhì)則由中心極限定理來解釋如下:a:只要數(shù)學(xué)期望和方差存在,從總體中隨機相互獨立抽取n個樣本,則樣本平均數(shù)是隨機變量;b:當n夠大 (一般n>30) 時,則N(,)c:特別總體服從二點分布p(x=i)=p,p(

3、x=0)=1-p時,則期望p方差p(1-p) 故放回抽樣時,);不放回抽樣時,(1-)。樣本平均數(shù)之差的分布:如果總體1:X,抽n1個樣本,如果總體2:Y,抽n2個樣本,則二、抽樣設(shè)計1、 簡單隨機抽樣: 事前編好隨機數(shù)據(jù)表總體(全部編號) 標簽(混合) 用手隨機模取 抽樣 搖號機2、 類型抽樣(分層抽樣或分類抽樣):總體(按特征標志分組) 組1 隨機抽樣 組k 隨機抽樣分配原則:等數(shù);等比例;最優(yōu)設(shè):總體為N(總體樣本為n) ;分成k 組,第i組包含Ni個單位,樣本為ni 等數(shù):n1=n2=.= nk=等比例:;樣本數(shù)最優(yōu):標志變動程度為,樣本數(shù)樣本平均數(shù)i組:; 總體:樣本平均數(shù)總體方差:

4、全樣本平均數(shù)的方差是各類型方差的加權(quán)綜合樣本平均數(shù)i組方差:是第i組內(nèi)資料的方差,取各類型樣本方差的加權(quán)數(shù)綜合3、 整群抽樣:總體(按標志分成若干群)隨機抽取r個群樣本總體分為R個群,每群含為M個單位。設(shè)為第i個群中的第j個單位的標志值。i群平均數(shù): i=1,2,r總體平均數(shù):總體方差: 樣本平均數(shù)的群間方差其中,為總體各群的平均數(shù);為總體的總平均數(shù)樣本方差: 樣本的群間方差其中,為抽樣各群的樣本平均數(shù);為抽樣各群全體樣本的平均數(shù)整群不放回抽樣樣本平均數(shù)的方差:注:等距抽樣;多階段抽樣;雙相抽樣;穿插抽樣(略)。第二章:參數(shù)估計與假設(shè)檢驗一、參數(shù)估計問題隨機變量特征(概率分布;均值;方差) 如

5、何? 解決方式:根據(jù)樣本來估計所要的信息;具體思路:用樣本統(tǒng)計量估計總體參數(shù)。1、參數(shù)點估計量優(yōu)劣的判別準則和常用的估計量點估計:用樣本統(tǒng)計量估計總體參數(shù)一個明確的估計值準則:無偏性-令為被估計參數(shù);為的無偏估計量;則 一致性:樣本容量越大,估計量的值越接近于被估計總體參數(shù) 有效性:,如果的方差比的方差小,則比有效常用估計量: 用樣本的平均數(shù)估計總體平均數(shù),即 用樣本方差和標準差s估計總體方差和標準差即; 用樣本中具有某特征單位的比例估計總體比率p,即2、參數(shù)區(qū)間估計問題 區(qū)間估計:用樣本估計總體參數(shù)可能取值的區(qū)間(給出了點估計可靠性的一種描述,是點估計的補充)選擇兩個統(tǒng)計量1和2估計P(11

6、-(事先給定的正數(shù)),且1<2,1,2 稱為置信水平為1的置信區(qū)間;1置信概率(置信水平或置信系數(shù));實有意義:有100(1-)%把握斷定在1,2內(nèi)。(1) 總體平均數(shù)的區(qū)間估計假設(shè):總體服從正態(tài)分布N() ; 隨機變量X的概率密度函數(shù):f(x)= ;記作:xN()如果令:Z(統(tǒng)計量)則E(Z)E()0D(Z)EE()E(=1所以:ZN(0,1)標準正態(tài)分布 密度函數(shù)f(x)= 分布函數(shù)(x)=(-x)=1-(x), P(azb)=P(Zb)-P(Za)第一種情況:樣本取自總體方差已知(即已知)的正態(tài)分布,對總體期望值的區(qū)間估計已知:總體隨機變量XN(, 2),則N(, 2/n) ,其中

7、;2/n(放回)令:Z,則ZN(0,1)查正態(tài)分布表:PZr=P(rZr)=2(r)-1如果令P(Zr)0.955 則(r)0.9775(標準正態(tài)表得:r 2)即P(22)=0.955也就是:P(22)0.955(值落在總體平均數(shù)正負兩個標準差之內(nèi)的概率為95.5%)可得P(22)0.955對的一個區(qū)間估計(總體平均數(shù)有95.5%的可能性位于樣本平均數(shù)的正負兩個標準差之內(nèi))一般令:P(Z),(0<1則P1,(0<1,一般=0.05或0.01稱為概率密度置信水平估計量的標準差與概率度的乘積故的區(qū)間估計一般記為:±或± (放回)±稱為置信區(qū)間(有100(1

8、)%的把握說明總體平均值在這個區(qū)間內(nèi)例:P0.99P0.9952.58 152.5815+2.5812.4217.58第二種情況:樣本取自總體方差已知(已知)的非正態(tài)分布(中心極限定理n30)例:P0.95P0.9751.96第三種情況:(未知)用樣本標準差S估計總體標準差(即:的估計值為)令:Z為變量引進新變量t= (討論t值的概率度;t的自由度為n-1)的區(qū)間估計一般計為:(總體分布對正態(tài)總體偏離不大時)例:P175(例8.3)已知:S0.08;n=16; =1 求解95%的置信區(qū)間(=0.05;/2=0.025) 求解:查自由度n-1=15的t分布(n個樣本知道僅有n-1是獨立的)得:(

9、n-1)=2.13(2)正態(tài)總體方差的區(qū)間估計 方差 構(gòu)造統(tǒng)計量=(n-1)S2/2 證明 (衡量變量偏離總體平均數(shù)的尺度) 在正態(tài)分布的條件下,(n-1) (n-1為自由度) 分布的形狀由自度確定,它是非對稱的。當自由度為n 時,概率度為 時 P=給定置信水平1-:計算,查找出;使得:; 的100(1-)%的置信區(qū)間為<(n-1)S2/2<即:P(<(n-1)S2/2<)=1- P=1-所以:標準差的100(1-)% 的置信區(qū)間為:<<例P181(例8.7) :求95%的置信區(qū)間:=0.05 ,n=14查,n=14得:;故二、假設(shè)檢驗問題總體參數(shù)的假設(shè) 原

10、假設(shè)(零假設(shè))記作H0 替代假設(shè)(備擇假設(shè))記作H1要求原假設(shè)和替代假設(shè)相互獨立性。即H0真實H1不真實;或:H1真實H0不真實;也就是講:否定H0接受H1;或否定H1接受H0假設(shè)的類型: 1):H0:=0;H1 :0 雙邊檢驗 2):H0:0;H1 :<0 單邊檢驗 3):H0:0;H1 :>0 單邊檢驗假設(shè)檢驗:以樣本為依據(jù)構(gòu)造合適的檢驗統(tǒng)計量分析樣本統(tǒng)計值與參數(shù)假設(shè)值的差距就是原假設(shè)的顯著性檢驗 檢驗統(tǒng)計量= 樣本統(tǒng)計量-被假設(shè)的參數(shù) 統(tǒng)計量的標準差 結(jié)論:差距大 假設(shè)值的真實性小 差距小 假設(shè)值的真實性大例:Z=(標準正態(tài)分布統(tǒng)計量)t= (t分布的統(tǒng)計量)假設(shè)檢驗的步驟:

11、根據(jù)題意提出原假設(shè)H0和備擇假設(shè)H1選擇顯著性水平(0.05和0.01)選擇檢驗統(tǒng)計量及其分布根據(jù)顯著性水平確定統(tǒng)計量的否定域或臨界值(注意是雙邊還是單邊檢驗)根據(jù)樣本數(shù)據(jù)計算統(tǒng)計量的數(shù)值并作出推斷:如果統(tǒng)計量的值落在否定域內(nèi)否定原假設(shè)如果統(tǒng)計量的值落在接受域內(nèi)差異不顯著(接受原假設(shè))1、總體平均數(shù)的假設(shè)檢驗:假設(shè):H0:=0;H1:0 雙邊檢驗例:已知方差:50,n=25,=70 , =0.05 , 0=90檢驗:Z2 構(gòu)造統(tǒng)計量P(Z)= , =1.96 ; =-1.96Z(-1.96, 1.96) 否定原假設(shè)假設(shè):H0:0;H1:0 單邊檢驗例P190(例8.11)2、 總體方差的假設(shè)檢

12、驗例198(例8.17)第三章:回歸相關(guān)分析為了研究分析各種經(jīng)濟現(xiàn)象,就需要尋找能說明這些經(jīng)濟現(xiàn)象的各種經(jīng)濟變量,并確定這些變量之間的因果關(guān)系,探索這些變量之間的數(shù)量變化規(guī)律。這就是回歸相關(guān)分析一、建立回歸分析模型的步驟:1、理論模型設(shè)計選擇模型中將包含的變量(選擇某變量作為經(jīng)濟系統(tǒng)的“果” ,正確地選擇作為“因”的變量)。 按照經(jīng)濟行為理論和樣本數(shù)據(jù)顯示出變量之間關(guān)系構(gòu)造描述變量之間關(guān)系的數(shù)學(xué)表述式。 擬定模型中待估參數(shù)的符號及其大小的理論期望值范圍。2、樣本數(shù)據(jù)的收集常用的樣本數(shù)據(jù):時間序列數(shù)據(jù),截面數(shù)據(jù),虛變量數(shù)據(jù)(政策變量取值:0和1)選擇樣本數(shù)據(jù)的出發(fā)點:可得性和可用性。樣本數(shù)據(jù)的質(zhì)

13、量:實整性,準確性,可比性(數(shù)據(jù)的口徑問題)和一致性(樣本和母體必須一致。3、模型參數(shù)的估計樣本數(shù)據(jù)估計整體參數(shù)的具體取值。4、模型檢驗經(jīng)濟意義檢驗?zāi)P蛥?shù)估計值的可靠性檢驗(R2擬合優(yōu)度檢驗,t變量顯著性檢驗;F-方程顯著性檢驗)應(yīng)用檢驗(樣本容量變化的靈敏度分析進行穩(wěn)定性檢驗,精度檢驗,預(yù)測能力檢驗)二、多元回歸分析模型綜述:1、 理論模型設(shè)定:Y12x2+3x3+kxk+其中,Y為被解釋變量(果);1,2. k待估的參數(shù)(未知參數(shù)) ;x1, x2, x3.xk為解釋變量(因);為隨機擾動項抽取樣本代入設(shè)定模型得:Yi12x2i+3x3i+kxki+ii1,2,,n 樣本容量 : n&g

14、t;30(最低:n>3k或n>k)如果,令Y= Y1 = 1 = 1 X= 1 X 21 X31 Xk1Y2 2 2 1 X 22 X32 Xk2 . Yn k n 1 X 2n X 3n Xkn 則樣本模型:Y=X+2.基本假設(shè)(1) 隨機性: 為隨機變量(2) 零均值: E()=0(3) 同方差: (總體方差)(4) 無序列相關(guān)性:COV(i,j)=0 (解釋變量相互獨立) 協(xié)方差 :COV(X,Y)= pi 為(xi ,yi)出現(xiàn)的概率 相關(guān)系數(shù): CORR(x,y)=(5) Xji與i不相關(guān):解釋變量Xj (j=2,k) 在反復(fù)隨機抽樣中是選定的變量,故矩陣X的階數(shù)不變.(

15、6) Xji 之間不相關(guān):即秩(X)=k<n(7) 正態(tài)性: iN(0, 2u) . yiN(E(yi), 2u)即E(Yi) =12x2i+3x3i+kxki 樣本回歸超平面3、多元回歸分析的參數(shù)估計(O L S(Ordinary least square)(1) 參數(shù)的最小二乘法估計令:是參數(shù)的估計量;是Y的估計量。得:選擇參數(shù)的估計方法:估計值與實際值y之間的殘差,在所有樣本點上差值的平方和最小。即令:(i= 1,2,3,n)得:e=-=y-X要求:w=e= (y-X) (y-X)最小()(y-x) = = =令0具有以下性質(zhì):1)線性性:表示被解釋變量樣本值的線性組合2)無偏性:

16、3)最正確性:在的一切線性無偏估計中方差最小(2)參數(shù)的最小二乘估計 =令:m=; 得所以:其中,表示矩陣m主對角線元素之和則:令:為的方差估計量,則=4、模型檢驗擬合優(yōu)度檢驗(R2檢驗) :檢驗樣本回歸超平面與變量觀測值的樣本點接近的程度。 其中:為似合優(yōu)度系數(shù),分子為回歸平方和,分母為總平方和。 t檢驗:檢驗變量(j=1,2,k)解釋能力的強弱等價于對假設(shè)進行檢驗。構(gòu)造t統(tǒng)計量: 其中,為矩陣(主對角線上的元素,n-k為殘差平方和的自由度,即t統(tǒng)計量服從自由度為n-k的t分布。 假設(shè):原假設(shè),替代假設(shè)在給定顯著性水平的情況下檢驗步驟 第一步:計算不同統(tǒng)計量,記為,j=2,3,k 第二步:根

17、據(jù)和自由度(n-k),查出臨界值 第三步:作推斷:若干 在顯著性水平上拒絕H0 ,即最小二乘估計在統(tǒng)計上是可靠的(對的影響是顯著的)。 F檢驗:檢驗全部解釋變量對被解釋變量的聯(lián)合影響是否顯著。 假設(shè):構(gòu)造F統(tǒng)計量: F服從自由度為(k-1,n-k)的F分布。 檢驗步驟: 計算F統(tǒng)計量記為(以樣本數(shù)據(jù)) 以值查出臨界值 作推斷:若 在顯著性水平上拒絕H0獲得全部解釋變量的聯(lián)合影響是顯著的。 D.W檢驗:檢驗隨機項是否具有一階自回歸形式的序列相關(guān)(即上期對下期數(shù)據(jù)有直接影響)。 構(gòu)造D.W統(tǒng)計量: 注:n較大時, (1)存在完全一階正相關(guān):即 (2)存在完全一階負相關(guān): (3)完全不相關(guān): 檢驗步

18、驟: 計算的統(tǒng)計量記為以和解釋變量個數(shù),查分布表,得臨界值作推斷:若: 注:對于利用滯后被解釋變量作解釋變量的模型(檢驗失效) 值在2左右無需查檢驗表。三、具體應(yīng)用舉例:例如,對于一個具有三個解釋變量的線性經(jīng)濟計量模型,樣本容量n=25,應(yīng)用OLS估計參數(shù),顯示結(jié)果如下:Y=0.4150+0.4243X1+0.0184X2+0.5212X3(t=8.0) (t=1.4) (t=1.9)R2=0.94 F=1251.4 DW=1.41對顯示的結(jié)果進行判斷:(1) R2=0.94,說明回歸方程具有良好的擬合優(yōu)度(2) 顯著性水平,查F分布表得臨界值F0.01(3,21)=4.87,而F=1251.

19、4>>4.87,說明該方程在99%的顯著水平下仍是顯著成立的。(3) 顯著性水平,查t分布表得臨界值t0.025(21)=2.080,顯然|t1|=8>2.080;|t2|=1.4<2.080;|t3|=1.9<2.080,這說明解釋變量X1在95%的概率水平下顯著;X2,X3則在該概率水平下不顯著。顯著性水平,查t分布表得臨界值t0.05(21)=1.721,顯然|t3|=1.9>1.721,說明解釋變量X3在90%的概率水平下顯著。顯著性水平,查t分布表得臨界值t0.10(21)=1.323,顯然|t2|=1.4>1.323,說明解釋變量X2在80

20、%的概率水平下顯著。由此可見,決定是否剔除某個解釋變量需持慎重態(tài)度,在該模型中,三個解釋變量都可以保留。(4)顯著性水平,查DW分布表得:d1=1.12,dv=1.66而dl< DW=1.41<dv,根據(jù)檢驗,在95%的概率水平下,不能判斷模型的自相關(guān)狀態(tài)。第四章:模擬分析問題:線性規(guī)劃動態(tài)規(guī)劃都假設(shè)所有數(shù)據(jù)是事先確定的已知的,不包含概率因素網(wǎng)絡(luò)理論的。實際情況很少有符合分析模型的假設(shè),環(huán)境不確定性離散決策和復(fù)雜性,使現(xiàn)實中這些現(xiàn)象極為少見。模擬:可以解決問題( 不滿足分析建模的標準方法所規(guī)定的假設(shè))模擬的定義:是建立系統(tǒng)或決策問題的數(shù)學(xué)(或邏輯)模型,并以該模型進行試檢,以獲得對

21、系統(tǒng)行為的認識或幫助解決決策問題的過程。定義中的兩個要素:一是模型:它將問題或系統(tǒng)的任何適當假設(shè)模型化(模型是對實際系統(tǒng)思想或客體的抽象描述);二是模擬:用模型進行試驗并分析結(jié)果。模型的不同分類:模型分類:規(guī)定型模型:它決定著最優(yōu)策略或最正確行動過程 描述型模型:直接描述關(guān)系和提供評價信息,它用于解釋系統(tǒng)行為,預(yù)測輸入規(guī)劃過程的未來事件,并幫助決策者選擇滿意方案和系統(tǒng)設(shè)計 確定性:(數(shù)據(jù)已知或假設(shè)已知)模型分類: 概率型:(數(shù)據(jù)由概率分布決定)模型分類:離散型:變量隨時間跳躍的變動連續(xù)型:變量隨時間連續(xù)的變動模擬模型的類型:蒙特卡洛模擬模型(Monte Carlo simulation)系統(tǒng)模

22、擬模型(System simulation)蒙特卡洛模擬模型:基本上是抽樣試驗,其目的是估計以若干概率輸入變量而獲得結(jié)果變量的分布。它常被用于估計策略變動的預(yù)期影響和決策所涉風(fēng)險。例:Monte Carlo VAR模擬法Monte Carlo模擬法是基于歷史數(shù)據(jù)或既定分布的條件下的參數(shù)特征,借助隨機數(shù)產(chǎn)生的模擬方法模擬出大量的資產(chǎn)組合收益的數(shù)值,然后構(gòu)造資產(chǎn)組合收益的經(jīng)驗分布函數(shù),通過對經(jīng)驗分布函數(shù)的逆變換可求得VAR值。假定Y是絕對連續(xù)累積分布函數(shù)的隨機變量,對于0<q<1,令Yq表示唯一的值,使得:即就是:Yq是Y的分位點。當Fy連續(xù)時, 即Yq的統(tǒng)計量通過對隨機變量Y的經(jīng)驗分布的逆變換求得。假定Y1,Y2,Yn是隨機變量Y的n個獨立同分布的觀察變量,則Y的經(jīng)驗分布為:其中:故標準的統(tǒng)計量: 結(jié)論:分位點Yq的估計有兩種方法 構(gòu)造隨機變量Y的累積經(jīng)驗分布,然后通過對隨機變量Y的經(jīng)驗分布

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
  • 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 人人文庫網(wǎng)僅提供信息存儲空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負責(zé)。
  • 6. 下載文件中如有侵權(quán)或不適當內(nèi)容,請與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準確性、安全性和完整性, 同時也不承擔用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。

評論

0/150

提交評論