spss中數(shù)據(jù)管理PPT課件.ppt

上傳人：優(yōu)*** IP屬地：廣東上傳時間：2020-01-15 格式：PPT 頁數(shù)：54 大?。?.46MB 積分：68 舉報 版權(quán)申訴

已閱讀5頁，還剩49頁未讀，繼續(xù)免費閱讀

版權(quán)說明：本文檔由用戶提供并上傳，收益歸屬內(nèi)容提供方，若內(nèi)容存在侵權(quán)，請進行舉報或認領

文檔簡介

第三部分數(shù)據(jù)管理 SPSS的主菜單Edit和Data能夠建立數(shù)據(jù)文件進行數(shù)據(jù)編輯具有很強的數(shù)據(jù)管理功能主要包括定義變量屬性 DefineVariableProperties 插入變量 InsertVariable 插入個案 InsertCase 個案排序 SortCases 合并數(shù)據(jù)文件 MergeFiles 拆分數(shù)據(jù)文件 SpliteFiles 匯總數(shù)據(jù) AggregateData 識別重復個案 IdentifyDuplicateCases 及加權(quán)個案 WeightCases 等 1 數(shù)據(jù)管理分為四部分一變量管理二個案管理三數(shù)據(jù)文件管理四變量的變換和計算 2 一變量管理 1 插入變量或刪除變量建立數(shù)據(jù)集后可在DataView或VaribleView中插入新變量具體方法如下方法1 在DataView中插入新變量將光標移至想要插入的位置單擊右鍵或Data菜單InsertVariable 即可在當前光標所在的變量前插入一個 VAR00001 的新變量雙擊該變量名即可自動切換到VaribleView中可以對該變量名進行編輯并且定義其屬性 3 方法2 在VaribleViewer下將光標移至想要插入的位置單擊右鍵或Data菜單InsertVariable 即可在當前光標所在的變量前插入一個 VAR00001 的新變量可以對該變量名進行編輯并且定義其屬性注意插入或刪除個案類似例3 1調(diào)入數(shù)據(jù)文件02 1 sav 2 定義變量屬性 DefineVariableProperties 定義變量屬性 DefineVariableProperties 可為用戶在建立變量定性變量定序變量定距變量的描述性變量標識過程中提供幫助例3 2調(diào)入數(shù)據(jù)文件02 1 savData DefineVariableProperties 4 選中表示Unlabled 5 二個案管理 1 插入個案 InsertCase 2 個案定位 GoToCase 3 個案排序 SortCase 4 識別重復個案 IdentifyDuplicateCases 5 選擇個案 SelectCase 6 個案加權(quán) WeightCases 6 1 插入個案 InsertCase 或刪除個案例3 3在數(shù)據(jù)文件02 1 sav的第10個個案前插入一個名為王蒙 1975年2月28日出生體檢正常的個案將第5個個案刪除操作將光標移到第10個個案選擇Edit InsertCase 即在第10個個案前插入一空行也可右鍵快捷菜單操作 2 個案定位 GoToCase 使用GoToCase功能可以方便快捷的在大量數(shù)據(jù)中查找到指定的個案以便對其進行編輯修改或在其前插入新個案 7 例3 4在數(shù)據(jù)文件cesd sav中把第268個案的性別由女改為男選擇Edit GoToCase 在CaseNumber框中輸入268 OK 3 個案排序 SortCase SortCase能將數(shù)據(jù)文件中的數(shù)據(jù) 或字符進行排序排序的方法可以依據(jù)變量作為排序關鍵詞遞增或遞減排序大小順序或字典順序操作如下用鼠標選擇 DataSortCases 會彈出以下對話框圖2 12 選中考試成績單擊中間的黑三角把這個變量移至右面的矩形框中這個過程也可以通過雙擊考試成績完成再選擇排序方式升序或降序點擊 OK 就可以了 8 例3 5數(shù)據(jù)文件hong1 sav 試對體重從小到大排序注意排序變量可以為多個具體步驟如下 1 選擇var1作為第一排序變量 2 按照var1降或升如選降排列 3 選擇var2作為第二排序變量 4 按照var1降或升如選升排列 5 單擊OK 新數(shù)據(jù)覆蓋原數(shù)據(jù) 9 4 識別重復個案 IdentifyDuplicateCases 用戶在進行大樣本量的調(diào)研工作中可能重復訪問某個被訪對象或重復錄入某份試卷造成數(shù)據(jù)文件中包含重復個案引起偏倚利用識別重復個案 IdentifyDuplicateCases 用戶可以對重復個案進行查找并且進行剔除操作 Data IdentifyDuplicateCases出現(xiàn)以下對話框 10 1 定義個案配對變量2 配對組中的排序變量用戶可選擇1或多個變量作為排序依據(jù) 順序可選升或降 3 新建變量原始個案指示器 1表示原始個案0表示匹配個案每組最后一個個案為原始個案每組第一個個案為原始個案根據(jù)個案指示器的數(shù)值進行過濾自動劃出重復個案 11 4 對每組的匹配個案進行連續(xù)計數(shù) 創(chuàng)建一個順序號為0 n的數(shù)值變量其中0表示不匹配 5 將匹配個案移至文件的最上方6 顯示新建變量的頻數(shù)表例3 5在數(shù)據(jù)文件Identify sav中查找 id 重復的個案并且進行剔除 12 5 選擇個案 SelectCase 在SPSS中用戶可按一定準則選擇個案然后進行統(tǒng)計分析 Analyze 或作圖 Graphs 可以通過定義變量值或范圍日期數(shù)學表達式邏輯表達式或函數(shù)設定選擇個案的準則例3 6 對數(shù)據(jù)文件hong1 sav 用3種準則選擇滿足指定條件的部分個案并且進行頻數(shù)分析準則一對數(shù)據(jù)文件hong1 sav中滿足條件2 01 x6 3 00的體重 x6 的嬰兒對血紅蛋白x5進行頻數(shù)分析操作 Data SelectCaseIfconditionissatisfied輸入2 01 x6andx6 3 00Output中選擇filteroutunselectedcases注意生成一個新變量filter 滿足條件的個案一 1 表示未選中的個案的序號用斜劃線化掉 13 準則二在數(shù)據(jù)文件hong1 sav中隨機抽取30 的個案對血紅蛋白x5進行頻數(shù)分析在進行頻數(shù)分析時 var為filter 沒有也可和x5 操作 Data SelectCase Randomsampleofcases后出現(xiàn)以下對話框在所在個案中近似比例抽樣在前個個案前精確抽取個個案注意生成一個新變量filter 滿足條件的個案一 1 表示在進行頻數(shù)分析時 var為filter 和x5 14 準則三在數(shù)據(jù)文件hong1 sav中選取第10 33例的嬰兒對血紅蛋白x5進行頻數(shù)分析操作 Data SelectCase Basedontimeorcaserange Observation 注意不生成一個新變量在進行頻數(shù)分析時 var為x5 對滿足條件的個案進行分析 15 6 個案加權(quán) WeightCases 個案加權(quán) WeightCases 可在統(tǒng)計分析中對個案給予不同的權(quán)重權(quán)重變量中的數(shù)值表示數(shù)據(jù)文件中單個個案的觀察值注意當加權(quán)變量值為0 負值或缺失值的個案不參與分析例3 7某地144名正常男子的紅細胞數(shù) 1012 L 的整理數(shù)據(jù)見下表試進行頻數(shù)分布分析 16 建立數(shù)據(jù)文件weight sav 變量名為x 紅細胞數(shù) f 人數(shù) 2 對變量f進行加權(quán) 選擇Data Weightcases 完成個案加權(quán) 3 對變量x進行頻數(shù)分布分析畫相應的直方圖 17 三數(shù)據(jù)文件管理 1 數(shù)據(jù)的合并統(tǒng)計分析的首要任務是將數(shù)據(jù)輸入到計算機中在數(shù)據(jù)量較大時經(jīng)常需要將一份大的數(shù)據(jù)文件分成幾個小部分分別由幾個人輸入然后將若干個小的數(shù)據(jù)文件合并成一個大的數(shù)據(jù)文件數(shù)據(jù)文件的合并有兩種方式縱向合并和橫向合并縱向合并就是將一個SPSS數(shù)據(jù)文件的內(nèi)容追加到數(shù)據(jù)編輯窗口當前數(shù)據(jù)的后面然后將合并后的數(shù)據(jù)重新顯示在數(shù)據(jù)編輯窗口中通過該方法可以將兩個或更多個數(shù)據(jù)文件合并在一起 1 縱向合并 18 縱向合并操作 Date MergeFiles Addcases 例3 8將數(shù)據(jù)文件身高縱和 sav的個案追加到身高 sav中 1 打開數(shù)據(jù)文件身高 sav 2 Date MergeFiles Addcases出現(xiàn)如下對話框 3 利用AnexternalSPSSdatafile導入要追加的數(shù)據(jù)文件身高縱和 sav 4 匹配變量直接進入對于未匹配變量工作數(shù)據(jù)文件的變量用標注外部數(shù)據(jù)變量用標注可pair配對 19 注選中Indicatecasesourceasvariable 合并后的數(shù)據(jù)文件會出現(xiàn)名為source01的變量取值0和1 0代表個案來自工作數(shù)據(jù)文件 1代表個案來自外部數(shù)據(jù)文件橫向合并橫向連接也就是變量值的合并利用橫向合并可以將兩個或兩個以上的具有相同個案的數(shù)據(jù)文件連在一起即將SPSS數(shù)據(jù)文件的內(nèi)容連接到當前數(shù)據(jù)編輯窗口的右邊然后將合并后的數(shù)據(jù)文件顯示在數(shù)據(jù)編輯窗口中橫向合并實質(zhì)是將兩個數(shù)據(jù)文件按照個案對應進行左右對接 20 實現(xiàn)數(shù)據(jù)文件的橫向連接必須有一個相同的公共變量這個變量是兩個數(shù)據(jù)文件橫向?qū)B接的依據(jù) 同時將這一公共變量排序注意在合并的兩個數(shù)據(jù)文件中數(shù)據(jù)含義不同的變量變量名不應取相同的名稱例3 9 將數(shù)據(jù)文件身高橫合和 sav的個案追加到身高 sav中 1 打開數(shù)據(jù)文件身高 sav 2 Date MergeFiles Addvariables出現(xiàn)如下對話框 3 利用AnexternalSPSSdatafile導入要追加的數(shù)據(jù)文件身高橫和 sav 4 匹配變量直接進入工作數(shù)據(jù)文件的變量用標注外部數(shù)據(jù)變量用標注 21 注選中Indicatecasesourceasvariable 合并后的數(shù)據(jù)文件會出現(xiàn)名為source01的變量取值0和1 0代表個案來自工作數(shù)據(jù)文件 1代表個案來自外部數(shù)據(jù)文件 22 數(shù)據(jù)文件的分組 split 數(shù)據(jù)文件的拆分是指將數(shù)據(jù)按某個或某幾個變量分成一些供統(tǒng)計分析的分組在統(tǒng)計中經(jīng)常需要先按某個變量進行分組然后再求各個組的統(tǒng)計分析例如想分別了解男生和女生的成績情況這時就需要按照性別變量進行數(shù)據(jù)文件的分組這種分組是系統(tǒng)內(nèi)定義的在數(shù)據(jù)管理器中并不一定明確體現(xiàn) 故亦可稱之為分割注意用戶一旦設置了分組那么此后的所有分析都將按這種分組進行除非取消數(shù)據(jù)分組的命令例3 10 將數(shù)據(jù)文件child sav按性別年齡進行拆分并對體重與身高進行描述性分析 1 打開數(shù)據(jù)文件child sav 2 Date SplitFile出現(xiàn)如下對話框 23 1 分析所有個案不建立分組2 分組比較各分組的結(jié)果放在一起進行比較對于表格或圖表每個分組變量所產(chǎn)生的表將放在一起顯示 3 分組安排輸出結(jié)果所有程序產(chǎn)生的分組結(jié)果將獨立顯示 4 分組依據(jù) 本例使用性別年齡可多選 5 按分組變量排序6 文件已排序 24 數(shù)據(jù)的行列轉(zhuǎn)置 Transpose 行列轉(zhuǎn)置可將數(shù)據(jù)文件中的個案行轉(zhuǎn)換成變量列變量列轉(zhuǎn)換成個案行行列轉(zhuǎn)置可對新變量自動命名并顯示新變量名列表使用行列轉(zhuǎn)置可以自動產(chǎn)生一個包含原始變量名的字符串變量case 1b1 以便用戶了解各個個案對應的原變量名注意如果數(shù)據(jù)文件中含有變量值是唯一的變量可利用其作為名稱變量Namevariable 該變量的值將用于生成轉(zhuǎn)置后數(shù)據(jù)文件的變量名例3 11 對數(shù)據(jù)文件body1 sav進行行列轉(zhuǎn)置 1 打開數(shù)據(jù)文件body1 sav 2 Date Transpose出現(xiàn)如下對話框 25 也可以用此方法將數(shù)據(jù)再轉(zhuǎn)換回原來的排列方式注意行列轉(zhuǎn)置前若對工作數(shù)據(jù)進行修改請先保存數(shù)據(jù)文件否則修改的信息會丟失 26 2020 1 15 27 數(shù)據(jù)分類匯總 AggregateData 用戶還可對數(shù)據(jù)編輯器中的數(shù)據(jù)按指定變量的數(shù)值進行歸類分組匯總在SPSS中實現(xiàn)數(shù)據(jù)文件的分類匯總需要3個步驟首先需要指定分類變量和匯總變量然后計算機根據(jù)分類變量的若干個不同取值將個案數(shù)據(jù)分成若干類并對每類個案計算匯總變量的描述統(tǒng)計量最后將分類匯總計算結(jié)果保存到一個文件中例3 12 對數(shù)據(jù)文件child sav按性別年齡進行匯總數(shù)據(jù) 計算各組個案體重身高坐高胸圍及頭圍的平均數(shù) 1 打開數(shù)據(jù)文件child sav 2 Date AggregateData出現(xiàn)如下對話框 28 1 分組變量列表選一個或多個數(shù)值型或字符型變量作為分組變量 2 匯總變量列表顯示在匯總文件中用匯總函數(shù)產(chǎn)生的新變量的名稱及表達式匯總的原變量必須是數(shù)值型分組匯總提供的函數(shù)形式主要有以下幾種 Mean 求該組的平均值Median 求該組所有觀察值的中值Sum 求該組所有觀察值的和Standarddeviation 求該組的標準差First 只保持該組的第一個數(shù)值Last 只保持該組的最后一個數(shù)值等等 29 常見匯總函數(shù) 30 31 Name lable選項可逐一為匯總變量定義變量名和標簽 Numberofcases選項會在新文件中創(chuàng)建一個變量用來計數(shù)每一組觀測值的數(shù)目系統(tǒng)默認文件名為N BREAK 3 Save單選框 32 對于缺失值可采取多種手段進行科學替代這里的缺失值必須是系統(tǒng)或用戶指定的缺失值缺失值的代替例3 13 替代數(shù)據(jù)文件收入 sav中的缺失值 1 打開數(shù)據(jù)文件收入 sav 2 Transform ReplaceMissingValues出現(xiàn)如下對話框 33 3 在變量名列中選擇一個或多的存在缺失值的變量使之添加到newvariables 這是系統(tǒng)自動產(chǎn)生用于替代缺失值的新變量也可在name框處自己定義替代缺失值的新變量 Method共有以下幾種替代方式 Seriesmean Meanofnearbypoints Medianofnearbypoints Linearinterpolation 用缺失值相鄰兩點的中點值做替代 Lineartrendatpoint 用線性擬合方式確定替代值注意變量在選中狀態(tài)時nameandmethod可用 4 確定替代方式 change ok 34 四變量的變換和計算通過計算建立新變量 ComputeVariable 經(jīng)過調(diào)查研究所得到的原始數(shù)據(jù)非常重要很多時候?qū)υ紨?shù)據(jù)可以進行重新計算如從年收入中可以計算出一個新變量月收入等從而生成新的變量例3 14 現(xiàn)有某班的5門功課期末考試成績為了進一步的分析需要先對數(shù)據(jù)進行整理要求算出5門功課的總分平均分加權(quán)總分語文數(shù)學的權(quán)重為1 2 物理化學的權(quán)重為1 生物的權(quán)重為0 7 35 1 打開數(shù)據(jù)文件test sav2 選擇 Transform 菜單的 ComputeVariable 項彈出如圖所示的 ComputeVariable 計算變量對話框 3 在該對話框中的 TargetVariable 目標變量框中輸入符合變量命名規(guī)則的變量名 4 在數(shù)值表達式框中輸入表達式如圖示 5 打開標簽輸入變量標簽 ok 注意函數(shù)的使用 36 例3 14 建立新變量使得語文成績 80的為一組 60 語文成績 80的為一組低于60的是一組 1 打開數(shù)據(jù)文件test sav2 選擇 Transform 菜單的 ComputeVariable 項彈出如圖所示的 ComputeVariable 計算變量對話框 3 在該對話框中的 TargetVariable 框中輸入變量名group 4 在數(shù)值表達式框中輸入 1 如圖示 5 打開標簽輸入變量標簽語文分組 6 打開if 37 如圖操作 continue ok重復這一過程對目標變量grounp分別定義60 語文成績 80的為一組低于60的是一組的情況 38 產(chǎn)生計數(shù)變量 count Count過程用于標識某個值或某些值在某個變量的取值中是否出現(xiàn) 在統(tǒng)計分析中有一項特定變量值計算功能它可以計數(shù)在一個觀測值中滿足特定要求的那些變量值出現(xiàn)的次數(shù) 并將結(jié)果記錄在一個新變量中例3 15 統(tǒng)計一下數(shù)據(jù)文件test 1 sav中每個個案語文數(shù)學物理化學4門課成績有幾門80分以上 1 打開數(shù)據(jù)文件test 1 sav2 選擇Transform CountValuewithinCases彈出如下對話框 39 打開DefineValues對話框Continue ok 40 例在某次調(diào)查中有10個問題供調(diào)查者回答回答正確為1 錯誤為0 請計算每個調(diào)查對象回答正確的題目數(shù) 數(shù)據(jù)文件為count sav 1 打開數(shù)據(jù)文件為count sav 2 選擇Transform CountValuewithinCases3 目標變量定義為正確題數(shù) 4 數(shù)值變量列表 q1 q2 q105 definevalues value 1 add6 continues ok 41 變量重新賦值變量重新賦值功能是指將數(shù)據(jù)文件中的原變量按照某種一一對應的關系生成新變量值可以用這個新變量值替代原變量值也可以生成一個新變量的過程這種操作只適用于數(shù)值型變量在 Transform 菜單中的有 RecodeIntoSameVariables 和 RecodeIntoDifferentVariables 兩種賦值方法供選擇選擇命令 RecodeIntoSameVariables 時系統(tǒng)將產(chǎn)生新變量值直接替代原變量值執(zhí)行 RecodeIntoDifferentVariables 命令系統(tǒng)將為產(chǎn)生的新變量值賦給一個新變量例要求在 Employeedata sav 文件中將原變量educ中的值教育的年數(shù)重新賦值為新變量edulever 教育的等級系統(tǒng)缺失值仍為缺失值教育年數(shù)為8的轉(zhuǎn)化為第1等級教育年數(shù)為12 15之間的轉(zhuǎn)化為第2等級教育年數(shù)為16 19的轉(zhuǎn)化為第3等級教育年數(shù)為19年以上的轉(zhuǎn)化為第4等級 42 具體操作如下 InputVariable OutputVariable 框 educOutputVariable Name eduleverLable 教育的等級單擊change按鈕單擊oldandnewvalues按鈕OldnewSysmis sysmis8 112thru15 216thru18 319thruhighest 4單擊continue按鈕 ok 43 44 注意在上述兩種賦值情況下用戶均可通過單擊 If 按鈕指定條件來確定參與重新賦值的個案與前面根據(jù)已存在的變量建立新變量方法不同的是變量的重新賦值Recode不能進行運算只能根據(jù)指定變量值作數(shù)值轉(zhuǎn)換且這種轉(zhuǎn)換是單一數(shù)值的轉(zhuǎn)換變量的自動賦值 AutomaticRecode 變量的自動賦值可以將字符型數(shù)字型數(shù)值轉(zhuǎn)變成連續(xù)的整數(shù) 并將結(jié)果保存在一個新的變量中其中字符型數(shù)據(jù)按照字母的順序排序在SPSS中的的許多模塊中分類編碼不連續(xù)會產(chǎn)生空白的統(tǒng)計格子從而導致效能降低增加內(nèi)存的需要如 gender用二分類變量用f表示女用m表示男這是字符型數(shù)據(jù) 當轉(zhuǎn)成1女2男時化為連續(xù)的數(shù)值型例將字符型變量 gender 自動重新賦值為數(shù)值型變量新變量名 sex 45 具體操作步驟如下 1 打開數(shù)據(jù)文件Employeedata sav2 Transform AutomaticRecode3 varible newvarible gender4 newname sex單擊 addnewname 5 recodestartingfrom lowestvalue 從最小值開始 ok 46 注由自動重新編碼產(chǎn)生的變量將保留變量的定義及值標識對于無值標識的值則將原值作為重新編碼值的標識并產(chǎn)生一個新舊值及值標識的對應表 47 變量定義信息的查詢在SPSS數(shù)據(jù)編輯窗口中的 VariableView 標簽中可以看到變量的定義信息在其中還可以進行修改在SPSS的 Utilities 菜單下的Varible命令中還提供了變量信息的查詢功能在對話框左邊的變量列表中選擇某個變量右邊的 variableinformation 框中就會顯示該變量的數(shù)據(jù)類型變量標簽缺失值規(guī)定變量值標簽等信息單擊 goto 按

人人文庫> 全部分類> 教育資料 > 課件下載

溫馨提示

1. 本站所有資源如無特殊說明，都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
2. 本站的文檔不包含任何第三方提供的附件圖紙等，如果需要附件，請聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
3. 本站RAR壓縮包中若帶圖紙，網(wǎng)頁內(nèi)容里面會有圖紙預覽，若沒有圖紙預覽就沒有圖紙。
4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
5. 人人文庫網(wǎng)僅提供信息存儲空間，僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護處理，對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯，并不能對任何下載內(nèi)容負責。
6. 下載文件中如有侵權(quán)或不適當內(nèi)容，請與我們聯(lián)系，我們立即糾正。
7. 本站不保證下載資源的準確性、安全性和完整性, 同時也不承擔用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。

spss中數(shù)據(jù)管理PPT課件.ppt

文檔簡介

溫馨提示

最新文檔

評論

spss中數(shù)據(jù)管理PPT課件.ppt

文檔簡介

溫馨提示

最新文檔

評論

相關文檔