




版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請(qǐng)進(jìn)行舉報(bào)或認(rèn)領(lǐng)
文檔簡(jiǎn)介
1、Stata 命令語句格式:by varlist: command varlist =exp if exp in range weight , options1、by varlist:*如果需要分別知道國(guó)產(chǎn)車和進(jìn)口車的價(jià)格和重量,可以采用分類操作來求得,sort foreign /按國(guó)產(chǎn)車和進(jìn)口車排序. by foreign: sum price weight*更簡(jiǎn)略的方式是把兩個(gè)命令用一個(gè)組合命令來寫。. by foreign, sort: sum price weight如果不想從小到大排序,而是從大到小排序,其命令為 gsort。. sort - price /按價(jià)格從高到低排序. sor
2、t foreign -price /*先把國(guó)產(chǎn)車都排在前,進(jìn)口車排在后面,然后在國(guó)產(chǎn)車內(nèi)再按價(jià)格從大小到排序,在進(jìn)口車內(nèi)部,也按從大到小排序*/2、=exp賦值運(yùn)算. gen nprice=price+10 /生成新變量 nprice,其值為 price+10/*上面的命令 generate(略寫為 gen) 生成一個(gè)新的變量,新變量的變量名為nprice,新的價(jià)格在原價(jià)格的基礎(chǔ)上均增加了 10 元。. replace nprice=nprice-10 /*命令 replace 則直接改變?cè)兞康馁x值, nprice 調(diào)減后與 price 變量取值相等*/3、if exp條件表達(dá)式. list
3、 make price if foreign=0*只查看價(jià)格超過 1 萬元的進(jìn)口車(同時(shí)滿足兩個(gè)條件),則. list make price if foreign=1 & price>10000*查看價(jià)格超過 1 萬元或者進(jìn)口車(兩個(gè)條件任滿足一個(gè)). list make price if foreign=1 | price>100004、in range范圍篩選sum price in 1/5注意“1/5”中,斜杠不是除號(hào),而是從 1 到 5 的意思,即 1,2,3,4,5。如果要計(jì)算前 10 臺(tái)車中的國(guó)產(chǎn)車的平均價(jià)格, 則可將范圍和條件篩選聯(lián)合使用。. sum pric
4、e in 1/10 if foreign=05、weight 加權(quán)sum score weight=num 其中,num為每個(gè)成績(jī)所對(duì)應(yīng)的人數(shù)6、, options其他可選項(xiàng)例如,我們不僅要計(jì)算平均成績(jī),還想知道成績(jī)的中值,方差,偏度和峰度等*/. sum score, detail. sum score, d /d 為 detail 的略寫,兩個(gè)命令完全等價(jià). list price, nohead /不要表頭Stata 數(shù)據(jù)類型轉(zhuǎn)換1、字符型轉(zhuǎn)化成數(shù)值型destring, replace /全部轉(zhuǎn)換為數(shù)值型, replace 表示將原來的變量(值)更新destring date, repla
5、ce ignore(“ ”) 將字符型數(shù)據(jù)轉(zhuǎn)換為數(shù)值型數(shù)據(jù): 去掉字符間的空格destring price percent, gen(price2 percent2) ignore(“$ ,%”) 與 date 變量類似,變量 price 前面有美元符號(hào),變量 percent 后有百分號(hào),換為數(shù)值型時(shí)需要忽略這些非數(shù)值型字符2、數(shù)值型轉(zhuǎn)化為字符型tostring year day, replace /將年和日轉(zhuǎn)化為字符型gen date1=month+”/”+day+”/”+year /month day變?yōu)樽址秃罂梢赃\(yùn)算,將年月日構(gòu)成一個(gè)新的日期變量 gen date2=date(date
6、1,”mdy”) /* date()為日期函數(shù),它以 1960 年 1 月 1日為第 0 天,計(jì)算從那天起直到括號(hào)中指定的某天 date1一共過了多少天。 ”mdy”指定 date1 的排列順序,這里是按照月日年的順序來表示日期。*/數(shù)據(jù)顯示格式/*format 只控制數(shù)據(jù)的顯示格式,并不改變內(nèi)存中數(shù)據(jù)的大小。 */變量的格式為 %14s,表示右對(duì)齊,共 14 個(gè)字符,%為固定用法(字符變量跟s,數(shù)值變量跟g)ormat state %-14s / 該命令使 stata 的顯示格式左對(duì)齊,14 前面多了個(gè)負(fù)號(hào)format pop %11.0gc /*pop 的顯示格式為 %11.0g,后面加上
7、 c,則每三位數(shù)間用逗號(hào)分開,c 為 comma 的意思.*/format medage %8.1f /要求所有的 medage 都顯示一位小數(shù)format id %05.0f /對(duì)于編號(hào),我們希望前面用零使得位數(shù)對(duì)齊,通過在前面補(bǔ)零,所有的 id 都成了5位數(shù)。導(dǎo)入/導(dǎo)出其他格式數(shù)據(jù)1、數(shù)據(jù)導(dǎo)入insheet using 3origin.csv/txt, clearinsheet using 3origin.txt, double clear 當(dāng)數(shù)據(jù)中某個(gè)變量的位數(shù)特別長(zhǎng)或者對(duì)導(dǎo)入數(shù)據(jù)的精度要求很高的時(shí)候,需要在該命令后面加 double 選項(xiàng)。2、數(shù)據(jù)導(dǎo)出outsheet using my
8、result.asc, nonames 如果不希望在第一行存儲(chǔ)變量名,則可以使用 nonames 選項(xiàng)outsheet using myresult.asc, nonames replace 如果文件已經(jīng)存在,則需要使用 replace 選項(xiàng)數(shù)據(jù)合并1、 縱向合并use male, clear /打開記錄男生信息的數(shù)據(jù)文件 maleappend using female /將記錄女生信息的 female 文件追加到當(dāng)前數(shù)據(jù)集中save mydata1, replace2、 橫向合并use economy,clear /打開經(jīng)濟(jì)學(xué)成績(jī)數(shù)據(jù)文件sort id /按學(xué)號(hào)排序save economy,
9、 replace /重新保存一下use student,c clear /打開學(xué)生基本信息數(shù)據(jù)文件sort id /按學(xué)號(hào)排序merge id using economy /以學(xué)號(hào)為關(guān)聯(lián), 將學(xué)生的信息和成績(jī)一一對(duì)應(yīng)對(duì)接tab _merge /顯示對(duì)接情況,3 表示成功對(duì)接, 1 和 2 表示未成功對(duì)接drop _merge /去掉標(biāo)識(shí)對(duì)接是否成功變量_mergeStata很多命令可單獨(dú)使用,單獨(dú)使用時(shí),一般是對(duì)所有變量進(jìn)行操作,等價(jià)于后面加上代表所有變量的_all數(shù)據(jù)重整1、長(zhǎng)寬轉(zhuǎn)換寬:長(zhǎng):1)寬變長(zhǎng)use mywide, clearreshape long math economy, i(
10、id name) j(year) /數(shù)據(jù)重整,寬變長(zhǎng)save mylong, replace2)長(zhǎng)變寬reshape wide*或者use mylong, clearreshape wide math economy, i(id name) j(yearr) /數(shù)據(jù)重整,長(zhǎng)變寬save mywide2, replace2、多列數(shù)據(jù)轉(zhuǎn)為少數(shù)幾列有些數(shù)據(jù)集雖然有很多列,但實(shí)際上只有一個(gè)變量,利用stata轉(zhuǎn)化成一項(xiàng)數(shù)據(jù)。stack var1-var6, into(x) clear x是新生成變量的名稱drop _stack 變量stack 記錄觀測(cè)值原來所在行數(shù)3、數(shù)據(jù)轉(zhuǎn)置use math,cle
11、arxpose, clear變量運(yùn)算:Stata中,加( +)號(hào)同樣可用于字符運(yùn)算,當(dāng)加號(hào)出現(xiàn)在兩個(gè)字符之間時(shí),兩個(gè)字符將被連成一個(gè)字符。比如把”我愛” “STATA”合并在一起,命令為:. scalar a=”我愛” +“STATA”一些運(yùn)算函數(shù):comb(n,k) 從 n 中取 k 個(gè)的組合fill() 自動(dòng)填充數(shù)據(jù)int(x) 取整log10(x) 以 10 為底的對(duì)數(shù)mod(x,y) 求余數(shù)round(x) 四舍五入di round(3.345,.1) /四舍五入到十分位,結(jié)果為 3.3di round(3.345,.01) /四舍五入到百分位,結(jié)果為 3.35di round(335
12、.1,10) /四舍五入到十位,結(jié)果為 340sqrt(x) 開更號(hào)substr(s,n1,n2) 從 S 的第 n1 個(gè)字符開始,截取 n2 個(gè)字符word(s,n) 返回 s 的第 n 個(gè)字符_n 當(dāng)前觀察值的序號(hào)_N 共有多少觀察值gen y=sum(x) /求列累積和egen z=sum(x) /求列總和egen avgx=mean(x) /求列均值egen byte dxy = diff(x y) /當(dāng)x與y相等時(shí),differ取0,若不相等為1分離變量值clearinput str15 x"10*123""543*21""12*42
13、2""43532*32134""4349*1"endgen a=strpos(x,"*") /計(jì)算出*所在的位數(shù)gen b=substr(x,1,a-1) /取*前面的字符gen c=substr(x,a+1,.) /取*后面的字符stata中,系統(tǒng)缺失值大于任何一個(gè)數(shù)據(jù),因此在生成分類啞變量時(shí):gen agegrp2=(age>=65) if age<. 生成的數(shù)據(jù)中, 將缺失值排除在外生成分組變量:clearset obs 100 /設(shè)定 100 個(gè)觀察值gen age=_n /生成一個(gè)假設(shè)的年齡變量 age
14、,依次取 1, 2, , 100recode age (min/30=1) (30/60=2) (60/max=3),gen(agegrp) /*生成新的分組變量agegrp, 當(dāng)年齡age在30及以下時(shí)取值為 1,30到60為2,60以上為3*/分組運(yùn)算:by x, sort: gen n1=_n 根據(jù)x的不同,生成n1變量對(duì)不同類的x計(jì)數(shù)by hhid,sort: egen mage=mean(age) /根據(jù)不同類別求平均年齡 bysort hhid (age): gen nid1=_n /括號(hào)中的變量 age 只排序,不參于分組。bysort hhid age: gen nid2=_n
15、 / hhid 和 ag e 都既用來參與排序也分組encode country, gen(country1) 將文本變量轉(zhuǎn)化為數(shù)值變量display 5+9 顯示計(jì)算結(jié)果sum price weight 描述統(tǒng)計(jì):求價(jià)格和重量的觀察值個(gè)數(shù)、平均值、標(biāo)準(zhǔn)差、最小值和最大值scatter price weight 繪出價(jià)格和重量的散點(diǎn)圖line price weight, sort 繪出價(jià)格和重量的折線圖clear 清除內(nèi)存中原有內(nèi)容cd d:/stata9 在打開數(shù)據(jù)之前,先定位數(shù)據(jù)的位置use 打開 STATA 格式的數(shù)據(jù)文件set obs 5 /設(shè)定 5 個(gè)觀察值dir 查看當(dāng)前路徑下有哪
16、些文件save mydata /保存數(shù)據(jù),數(shù)據(jù)文件名為 mydatasave mydata, replace 如果同一文件夾下已經(jīng)存有 mydata.dta,而你又要再次執(zhí)行 save mydata 時(shí)edit 編輯數(shù)據(jù)log 將輸出結(jié)果存放入結(jié)果文件gen id=_n /生成一個(gè)新變量id,根據(jù)觀測(cè)值排列順序從上到下取值依次為123replace id=9842 in 3 第三個(gè)觀測(cè)的id值改變compress /壓縮數(shù)據(jù),使之在不損失任何信息的前提下占用空間最小erase mydata1.dta 刪除文件,一定要帶上后綴名。報(bào)告數(shù)據(jù)describe 總體展示變量信息codebook 展示數(shù)據(jù)庫中的每個(gè)變量情況(有多少缺失值,主要分位數(shù),區(qū)間)list 列示內(nèi)存中的數(shù)據(jù)count
溫馨提示
- 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請(qǐng)下載最新的WinRAR軟件解壓。
- 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請(qǐng)聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
- 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會(huì)有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
- 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
- 5. 人人文庫網(wǎng)僅提供信息存儲(chǔ)空間,僅對(duì)用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對(duì)用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對(duì)任何下載內(nèi)容負(fù)責(zé)。
- 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請(qǐng)與我們聯(lián)系,我們立即糾正。
- 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時(shí)也不承擔(dān)用戶因使用這些下載資源對(duì)自己和他人造成任何形式的傷害或損失。
最新文檔
- 四中應(yīng)急疏散活動(dòng)方案
- 售假店鋪活動(dòng)方案
- 團(tuán)委新媒體特色活動(dòng)方案
- 團(tuán)隊(duì)直播籌備活動(dòng)方案
- 團(tuán)委宣講活動(dòng)方案
- 團(tuán)體兼職活動(dòng)方案
- 國(guó)慶活動(dòng)抓娃娃活動(dòng)方案
- 團(tuán)建活動(dòng)接圈活動(dòng)方案
- 品牌線下活動(dòng)方案
- 怎樣上心理健康課的課件
- 2024版新能源汽車充電站場(chǎng)地租賃及充電服務(wù)合同2篇
- 特種設(shè)備日管控、周排查、月調(diào)度模板
- 急性髓系白血病護(hù)理個(gè)案
- 兒童膿毒血癥護(hù)理
- 頂板事故應(yīng)急演練
- 智研咨詢發(fā)布:中國(guó)企業(yè)數(shù)字化解決方案行業(yè)市場(chǎng)發(fā)展環(huán)境及前景研究報(bào)告
- 《大學(xué)計(jì)算機(jī)基礎(chǔ)案例教程(微課版)第2版》全套教學(xué)課件
- 食堂食材配送采購 投標(biāo)方案(技術(shù)方案)
- 貴州遵義四中2022自主招生物理試卷試題真題(含答案)
- NBT 35095-2017 水電工程小流域水文計(jì)算規(guī)范
- 2024年廣東省中考生物試卷(含答案)
評(píng)論
0/150
提交評(píng)論