




已閱讀5頁,還剩5頁未讀, 繼續(xù)免費閱讀
版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請進行舉報或認領(lǐng)
文檔簡介
Stata軟件基本操作和數(shù)據(jù)分析入門第一講 Stata操作入門張文彤 趙耐青第一節(jié) 概況Stata最初由美國計算機資源中心(Computer Resource Center)研制,現(xiàn)在為Stata公司的產(chǎn)品,其最新版本為7.0版。它操作靈活、簡單、易學易用,是一個非常有特色的統(tǒng)計分析軟件,現(xiàn)在已越來越受到人們的重視和歡迎,并且和SAS、SPSS一起,被稱為新的三大權(quán)威統(tǒng)計軟件。Stata最為突出的特點是短小精悍、功能強大,其最新的7.0版整個系統(tǒng)只有10M左右,但已經(jīng)包含了全部的統(tǒng)計分析、數(shù)據(jù)管理和繪圖等功能,尤其是他的統(tǒng)計分析功能極為全面,比起1G以上大小的SAS系統(tǒng)也毫不遜色。另外,由于Stata在分析時是將數(shù)據(jù)全部讀入內(nèi)存,在計算全部完成后才和磁盤交換數(shù)據(jù),因此運算速度極快。由于Stata的用戶群始終定位于專業(yè)統(tǒng)計分析人員,因此他的操作方式也別具一格,在Windows席卷天下的時代,他一直堅持使用命令行程序操作方式,拒不推出菜單操作系統(tǒng)。但是,Stata的命令語句極為簡潔明快,而且在統(tǒng)計分析命令的設置上又非常有條理,它將相同類型的統(tǒng)計模型均歸在同一個命令族下,而不同命令族又可以使用相同功能的選項,這使得用戶學習時極易上手。更為令人嘆服的是,Stata語句在簡潔的同時又擁有著極高的靈活性,用戶可以充分發(fā)揮自己的聰明才智,熟練應用各種技巧,真正做到隨心所欲。除了操作方式簡潔外,Stata的用戶接口在其他方面也做得非常簡潔,數(shù)據(jù)格式簡單,分析結(jié)果輸出簡潔明快,易于閱讀,這一切都使得Stata成為非常適合于進行統(tǒng)計教學的統(tǒng)計軟件。Stata的另一個特點是他的許多高級統(tǒng)計模塊均是編程人員用其宏語言寫成的程序文件(ADO文件),這些文件可以自行修改、添加和下載。用戶可隨時到Stata網(wǎng)站尋找并下載最新的升級文件。事實上,Stata的這一特點使得他始終處于統(tǒng)計分析方法發(fā)展的最前沿,用戶幾乎總是能很快找到最新統(tǒng)計算法的Stata程序版本,而這也使得Stata自身成了幾大統(tǒng)計軟件中升級最多、最頻繁的一個。由于以上特點,Stata已經(jīng)在科研、教育領(lǐng)域得到了廣泛應用,WHO的研究人員現(xiàn)在也把Stata作為主要的統(tǒng)計分析工作軟件。第二節(jié) Stata操作入門一、Stata的界面圖1即為Stata 7.0啟動后的界面,除了Windows版本的軟件都有的菜單欄、工具欄,狀態(tài)欄等外,Stata的界面主要是由四個窗口構(gòu)成,分述如下:1結(jié)果窗口:位于界面右上部,軟件運行中的所有信息,如所執(zhí)行的命令、執(zhí)行結(jié)果和出錯信息等均在這里列出。窗口中會使用不同的顏色區(qū)分不同的文本,如白色表示命令,紅色表示錯誤信息。2命令窗口:位于結(jié)果窗口下方,相當于DOS軟件中的命令行,此處用于鍵入需要執(zhí)行的命令,回車后即開始執(zhí)行,相應的結(jié)果則會在結(jié)果窗口中顯示出來。3命令回顧窗口:即review窗口,位于界面左上方,所有執(zhí)行過的命令會依次在該窗口中列出,單擊后命令即被自動拷貝到命令窗口中;如果需要重復執(zhí)行,用鼠標雙擊相應的命令即可。4變量名窗口:位于界面左下方,列出當前數(shù)據(jù)及中的所有變量名稱,。除以上四個默認打開的窗口外,在Stata中還有數(shù)據(jù)編輯窗口、程序文件編輯窗口、幫助窗口、繪圖窗口、Log窗口等,如果需要使用,可以用Window或Help菜單將其打開。結(jié)果窗口變量名窗口命令回顧窗口命令窗口圖1 Stata 7.0啟動后的界面二、數(shù)據(jù)的錄入與儲存Stata為用戶提供了簡捷,但是非常完善的數(shù)據(jù)接口,熟悉它的用法是使用Stata的第一步,在Stata中讀入數(shù)據(jù)可以有三種方式:直接從鍵盤輸入、打開已有數(shù)據(jù)文件和拷貝、粘貼方式交互數(shù)據(jù)。1)從鍵盤輸入數(shù)據(jù)在Stata中可以使用命令行方式直接建立數(shù)據(jù)集,首先使用input命令制定相應的變量名稱,然后一次錄入數(shù)據(jù),最后使用end語句表明數(shù)據(jù)錄入結(jié)束。例1 在某實驗中得到如下數(shù)據(jù),請在Stata中建立數(shù)據(jù)集。觀測數(shù)據(jù)X 1 3 5 7 9Y 2 4 6 8 10解:此處需要建立兩個變量X、Y,分別錄入相應數(shù)值,Stata中的操作如下,其中劃線部分為操作者輸入部分。. drop _all. input x y x y 1. 1 2 2. 3 4 3. 5 6 4. 7 8 5. 9 10 6. end2)用stata的數(shù)據(jù)編輯工具進入數(shù)據(jù)編輯器進入stata界面,在命令欄鍵入edit或在stata的window下拉菜單中單擊data editor或點擊編輯圖標 (注意:是瀏覽圖標,點擊后只能瀏覽,不能編輯)即可進入stata數(shù)據(jù)編輯器。(stata界面如下圖2)圖2數(shù)據(jù)編輯stata 數(shù)據(jù)編輯器界面:此時進入了數(shù)據(jù)全屏幕編輯狀態(tài)。圖3在第一列輸入數(shù)據(jù)后,Stata第一列自動命名為var1;在第二列輸入數(shù)據(jù)后,第二列自動命名為var2依次類推。在輸入數(shù)據(jù)后,雙擊縱格頂端的變量名欄(如:Var1或Var2處),可以更改變量名,并可以在label欄中注釋變量名的含義,點擊OK確認(如圖4所示)。仍沿用上例,雙擊觀察值所在列頂端的變量名欄,更改變量名為x,并在label欄中注明 “7歲男童身高(cm)”。點擊此處可以改變量名圖4數(shù)據(jù)輸入完畢后,單擊preserve鍵確認所輸數(shù)據(jù),按關(guān)閉鍵 即可退出編輯器。圖5數(shù)據(jù)輸入完畢后,單擊preserve鍵確認所輸數(shù)據(jù),按關(guān)閉鍵 即可退出編輯器。3)拷貝、粘貼方式交互數(shù)據(jù)Stata的數(shù)據(jù)編輯窗口是一個簡單的電子表格,可以使用拷貝、粘貼方式直接和EXCEL等軟件交互數(shù)據(jù),在數(shù)據(jù)量不大時,這種方式操作極為方便。例2 現(xiàn)在EXCEL中已錄入了三個變量,共五條記錄,格式見下圖,請將數(shù)據(jù)讀入Stata。解:首先將EXCEL中的A1C6全部18個單元格選中,選擇菜單編輯復制,將數(shù)據(jù)拷貝到剪貼板上;然后切換到Stata,選擇菜單WindowData Editor,打開數(shù)據(jù)編輯窗口;再選擇EditPaste,相應的數(shù)據(jù)就會被直接粘貼如數(shù)據(jù)編輯窗口中,并且變量名、記錄數(shù)、變量格式等均會被自動正確設置,見圖6和圖7。圖6 在EXCEL中的數(shù)據(jù)格式圖7 粘貼入Stata后的數(shù)據(jù)格式4)、打開已有的數(shù)據(jù)文件Stata能夠直接打開的數(shù)據(jù)文件只能是自身專用格式或者以符號分隔的純文本格式,后者第一行可以是變量名,分述如下:1點擊圖標,然后選擇路徑和文件名,可以打開Stata專用格式的數(shù)據(jù)文件,并且擴展名為.dta。2.打開Dta數(shù)據(jù)文件:該格式文件是Stata的專用格式數(shù)據(jù)文件,也使用use命令即可打開,例如要打開數(shù)據(jù)文件“C:data1.dta”,則命令為:. use c:data1即擴展名可以省略,如果Stata中已經(jīng)修改或者建立了數(shù)據(jù)集,則需要使用clear選項清除原有數(shù)據(jù),命令為:. use c:data1 , clear3讀入文本格式數(shù)據(jù):需要使用insheet命令實現(xiàn),例如需要讀入已建立好的文本格式數(shù)據(jù)文件“C:data1.txt”,則命令為:. insheet using c:data1.txt該命令會自動識別第一行是否為變量名,以及變量列間的分隔符是tab、逗號還是其他字符。如果Stata中已經(jīng)修改或者建立了數(shù)據(jù)集,則需要使用clear選項清除原有數(shù)據(jù),命令為:. insheet using c:data1.txt , clear5)數(shù)據(jù)文件的保存為了方便以后重復使用,輸入Stata的數(shù)據(jù)應存盤。Stata實際上只能將數(shù)據(jù)存為自身專用的數(shù)據(jù)格式或者純文本格式,分述如下:1點擊圖標,然后選擇路徑和文件名,點擊保存。2.存為dta格式:可以直接使用文件菜單,也可以使用save命令操作,如欲將上面建立的數(shù)據(jù)文件存入“C:”中,文件名為Data1.dta,則命令為:. save c:data1file c:data1.dta saved該指令將在C盤根目錄建立一個名為“data1.dta”的Stata數(shù)據(jù)文件,后綴dta可以在命令中省略,會被自動添加。該文件只能在Stata中用use命令打開。如所指定的文件已經(jīng)存在,則該命令將給出如下信息:file c:data1.dta already exists,告訴用戶在該目標盤及子目錄中已有相同的文件名存在。如欲覆蓋已有文件,則加選擇項replace。命令及結(jié)果如下:. save c:data1.dta , replacefile c:data1.dta saved2存為文本格式:需要使用outsheet命令實現(xiàn),該命令的基本格式如下。outsheet 變量名列表 using 文件名 , nonames replace 其中變量
溫馨提示
- 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
- 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
- 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會有圖紙預覽,若沒有圖紙預覽就沒有圖紙。
- 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
- 5. 人人文庫網(wǎng)僅提供信息存儲空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負責。
- 6. 下載文件中如有侵權(quán)或不適當內(nèi)容,請與我們聯(lián)系,我們立即糾正。
- 7. 本站不保證下載資源的準確性、安全性和完整性, 同時也不承擔用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。
最新文檔
- 重慶五一職業(yè)技術(shù)學院《泥塑動物》2023-2024學年第二學期期末試卷
- 山東財經(jīng)大學《營銷理論前沿專題》2023-2024學年第二學期期末試卷
- 山東外事職業(yè)大學《中國民族音樂(一)》2023-2024學年第二學期期末試卷
- 廣東外語外貿(mào)大學《圖論與代數(shù)系統(tǒng)》2023-2024學年第二學期期末試卷
- 智慧辦公時代的城市交通優(yōu)化策略研究
- 廣西國際商務職業(yè)技術(shù)學院《會展設計》2023-2024學年第二學期期末試卷
- DB13T 5549-2022 深部導水通道微震探查規(guī)范
- 徐州工程學院《物流信息系統(tǒng)設計》2023-2024學年第二學期期末試卷
- 胃癌治療創(chuàng)新藥物行業(yè)深度調(diào)研及發(fā)展項目商業(yè)計劃書
- 云計算高可用架構(gòu)設計服務行業(yè)跨境出海項目商業(yè)計劃書
- 結(jié)構(gòu)動力學完整版本
- 2025年八年級數(shù)學下學期期末總復習八年級數(shù)學下學期期末測試卷(2)(學生版+解析)
- 四級閱讀測試題及答案
- 農(nóng)村供水水質(zhì)管理制度
- 建筑工地應急預案方案
- T/CIE 208-2024兒童機器人教育評價指南
- 2025年高考英語課后續(xù)寫高頻考點話題分類第07講 讀后續(xù)寫之成長類主題(講義)
- 2025年廣東中考百校聯(lián)考語文試卷 2025年廣東中考百校聯(lián)考語文試卷
- 2025年公路市場調(diào)研報告
- 生物+2025云南新高考自主命題沖刺金卷及答案
- 糖尿病眼病試題及答案
評論
0/150
提交評論